Eksploracja logów procesów. Process mining

Podobne dokumenty
A4 Klub Polska Audi A4 B6 - sprężyny przód (FWD/Quattro) Numer Kolory Weight Range 1BA / 1BR 1BE / 1BV

Obozowa liga zadaniowa (seria I wskazówki)

INŻYNIERIA BEZPIECZEŃSTWA LABORATORIUM NR 2 ALGORYTM XOR ŁAMANIE ALGORYTMU XOR

METODY KONSTRUKCJI ZA POMOCĄ CYRKLA. WYKŁAD 1 Czas: 45

miejsca przejścia, łuki i żetony

LXI Olimpiada Matematyczna

Klucz odpowiedzi do zadań zamkniętych i schemat oceniania zadań otwartych

Sieci Petriego. Sieć Petriego

V Międzyszkolny Konkurs Matematyczny

Zadania do cz. I. ggoralski.com. Autor: Grzegorz Góralski. środa, 9 listopada 11

Odbicie lustrzane, oś symetrii

Metody Programowania

Zależności funkcyjne

Pojęcie zależności funkcyjnej

7. Teoria drzew - spinanie i przeszukiwanie

PRÓBNY EGZAMIN MATURALNY

= a + 1. b + 1. b całkowita?

W. Guzicki Próbna matura, grudzień 2014 r. poziom rozszerzony 1

STOWARZYSZENIE NA RZECZ EDUKACJI MATEMATYCZNEJ KOMITET GŁÓWNY OLIMPIADY MATEMATYCZNEJ JUNIORÓW SZCZYRK 2017

Spis treści. Zadania... 7 Algebra... 9 Geometria Teoria liczb, nierówności, kombinatoryka Wskazówki Rozwiazania...

Hurtownie danych - przegląd technologii

EGZAMIN MATURALNY Z MATEMATYKI

Budowa modeli wymagań dla Regionalnych Systemów Informacji Medycznej opartych o hurtownie danych

S: Magnes na tłoku. Amortyzacja P: pneumatyczna regulowana

ZADANIE 2 Czy istnieje taki wielokat, który ma 2 razy więcej przekatnych niż boków?

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

Granica i ciągłość funkcji. 1 Granica funkcji rzeczywistej jednej zmiennej rzeczywistej

PRÓBNY EGZAMIN MATURALNY

Technika Próżniowa. Przyszłość zależy od dobrego wyboru produktu. Wydanie Specjalne.

B FB A D AEA D A A D E B E DE D A D D B A F EC AEAA D A DA E A BEA A D C D DC A B D B A D DA F EA BC B D F D B B A A E B C F DA E D D EA

Elementy cyfrowe i układy logiczne

1. Które składowe klasa posiada zawsze, niezależnie od tego czy je zdefiniujemy, czy nie?

PRÓBNY EGZAMIN MATURALNY

WYSTĄPIENIE POKONTROLNE

Kurs ZDAJ MATURĘ Z MATEMATYKI MODUŁ 11 Zadania planimetria

Ćwiczenia z Zaawansowanych Systemów Baz Danych

S: Magnes na tłoku. Amortyzacja P: pneumatyczna regulowana


Klasówka gr. A str. 1/3

S: Magnes na tłoku. Amortyzacja. pneumatyczna regulowana

DZIENNIK USTAW RZECZYPOSPOLITEJ POLSKIEJ

PRÓBNY EGZAMIN MATURALNY

LVIII Olimpiada Matematyczna

Matura 2011 maj. Zadanie 1. (1 pkt) Wskaż nierówność, którą spełnia liczba π A. x + 1 > 5 B. x 1 < 2 C. x D. x 1 3 3

ZADANIA ZAMKNIETE W zadaniach 1-25 wybierz i zaznacz na karcie odpowiedzi poprawna

Informatyka Ćwiczenie 10. Bazy danych. Strukturę bazy danych można określić w formie jak na rysunku 1. atrybuty

KURS MATEMATYKA DYSKRETNA

Zadania otwarte krótkiej odpowiedzi na dowodzenie

RACHUNEK ZBIORÓW 5 RELACJE

FUNKCJE. (odwzorowania) Funkcje 1

Inżynieria biomedyczna

Siatkówka halowa. Tabela Bergera dla 4 grupy A-F Tabela Bergera dla 5 grupy G-H. Mecz 1: 1-4 Mecz 1: 2-5. Mecz 2: 2-3 Mecz 2: 3-4

Treści zadań Obozu Naukowego OMJ

Jarosław Wróblewski Matematyka Elementarna, zima 2012/13

Adam Cankudis IFP UAM

Elżbieta Świda, Marcin Kurczab. Nowy typ zadań maturalnych z matematyki na poziomie rozszerzonym

Treści zadań Obozu Naukowego OMG

Jarosław Wróblewski Matematyka Elementarna, lato 2012/13. Czwartek 28 marca zaczynamy od omówienia zadań z kolokwium nr 1.

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006

Procesy ETL. 10maja2009. Paweł Szołtysek

PRÓBNY EGZAMIN MATURALNY

PRÓBNY EGZAMIN MATURALNY Z MATEMATYKI

Planimetria VII. Wymagania egzaminacyjne:

Wprowadzenie do zarządzania procesami biznesowymi

Treści zadań Obozu Naukowego OMG

PRÓBNY EGZAMIN MATURALNY

KRYTERIA OCENIANIA ODPOWIEDZI Próbna Matura z OPERONEM. Matematyka Poziom rozszerzony

Gramatyki, wyprowadzenia, hierarchia Chomsky ego. Gramatyka

Zadania przygotowawcze do konkursu o tytuł NAJLEPSZEGO MATEMATYKA KLAS PIERWSZYCH I DRUGICH POWIATU BOCHEŃSKIEGO rok szk. 2017/2018.

PRÓBNY EGZAMIN MATURALNY

Zadania egzaminacyjne

Problem kodowania w automatach

Wstęp do Techniki Cyfrowej... Algebra Boole a

KaŜdemu atrybutowi A przyporządkowana jest dziedzina Dom(A), czyli zbiór dopuszczalnych wartości.

Treści zadań Obozu Naukowego OMG

M P A P S - 50 X 100

Uzasadnienie tezy. AB + CD = BC + AD 2

Dawno, dawno temu przed siedmioma

Zadania z analizy matematycznej - sem. I Granice funkcji, asymptoty i ciągłość

1 Macierz odwrotna metoda operacji elementarnych

PRÓBNY EGZAMIN MATURALNY Z NOWĄ ERĄ

KONKURS MATEMATYCZNY DLA UCZNIÓW GIMNAZJUM Etap Rejonowy

Sprężyny naciągowe z drutu o przekroju okrągłym

WYDZIAŁ ELEKTRYCZNY. Optoelektroniczne pomiary aksjograficzne stawu skroniowo-żuchwowego człowieka


Granica i ciągłość funkcji. 1 Granica funkcji rzeczywistej jednej zmiennej rzeczywsitej

MATURA Przygotowanie do matury z matematyki

Spis tre±ci. Przedmowa... Cz ± I

Jarosław Wróblewski Matematyka Elementarna, zima 2013/14. Czwartek 21 listopada zaczynamy od omówienia zadań z kolokwium nr 2.

Zarządzanie statusami w PDC v.4.3.

Planimetria Uczeń: a) stosuje zależności między kątem środkowym i kątem wpisanym, b) korzysta z własności stycznej do okręgu i własności okręgów

Równania Pitagorasa i Fermata

3.4. Przekształcenia gramatyk bezkontekstowych

Splunk w akcji. Radosław Żak-Brodalko Solutions Architect Linux Polska Sp. z o.o.

II Warsztaty Matematyczne w I LO

Skrypt 28. Przygotowanie do egzaminu Podstawowe figury geometryczne. 1. Przypomnienie i utrwalenie wiadomości dotyczących rodzajów i własności kątów

Elementy teorii grafów Elementy teorii grafów

Nierówności. dla początkujących olimpijczyków. Aleksander Kubica Tomasz Szymczyk

Zbiory, relacje i funkcje

MATEMATYKA Instrukcja dla ucznia

Transkrypt:

Eksploracja logów procesów Process mining

Eksploracja logów procesów Celem eksploracji logów procesów biznesowych jest: Odkrywanie modelu procesów biznesowych Analiza procesów biznesowych Ulepszanie procesów biznesowych

Złożoność rzeczywistych procesów Szpital 2712 pacjentów 29258 zdarzeń 264 różnych zadań

Modele procesów, a rzeczywiste wystąpienia procesów model rzeczywistość Wystąpienia zgodne z modelem: 37,5% Wystąpienia niezgodne z modelem: 62,5%

Typy eksploracji procesów Odkrywanie dla procesów, które nie posiadają zdefiniowanych modeli, model może być zdefiniowany jako wynik eksploracji zebranych logów; np. ProM tworzy automatycznie model sieci Petriego Test zgodności modelu teoretycznego z rzeczywistym przebiegiem procesów wynikającym z logów procesów Ulepszanie modelu teoretycznego w oparciu o wiedzę wynikającą z logów procesów odkrywanie test zgodności ulepszanie

Pozyskiwanie informacji do logów Źródła informacji o przebiegu procesów operacyjne bazy danych hurtownie danych WfMS hurtownia danych operacyjne źródła danych ETL ekstrakcja ekstrakcja log WfMS nieodfiltrowane logi zdarzeń filtrowanie MXML, XES logi zdarzeń gotowe do eksploracji MXML, XES

Id wystąpienia Informacje w logach zdarzeń Trzy podstawowe perspektywy analizy danych Procesowa jak wykonywane są procesy Przypadków co dzieje się w firmie Organizacyjna kto uczestniczył w realizacji procesu Logi rejestrują wystąpienia procesów. Wystąpienia są uporządkowanymi sekwencjami zdarzeń. Zdarzenia są opisane przez atrybuty, np. czas wystąpienia, nazwa działania, koszt. Id zdarzenia Działanie Wykonawca Czas 107 A Rejestracja zamówienia Nowak 7 1 2008 9:45 108 B Wystawienie faktury Kowalski 7 1 2008 10:05 109 A Rejestracja zamówienia Tarzan 7 1 2008 12:17 110 C Wysłanie towaru Buła 7 1 2008 14:48 107 B Wystawienie faktury Kowalski 8 1 2008 8:15 110 E Potwierdzenie odbioru Nowak 8 1 2008 9:32

Zawartość logu MXML

Odkrywanie modelu procesów ABCD ACBD AED ABCD ABCD AED ACBD Odtwarzanie model procesu na podstawie zarejestrowanych sekwencji zdarzeń A B E C D

Kryteria jakości procesu odkrywania Trafność: Odkryty model powinien przewidywać możliwość wykonania wszystkich wystąpień procesów zapamiętanych w logu. Precyzja: Odkryty model nie powinien wspierać wystąpień procesu niepotwierdzonych przez informacje w logu (underfitting). Generalizacja: Odkryty model powinien generalizować przykłady wystąpień zarejestrowanych w logu (overfitting). Minimalność: Odkryty model powinien być tak prosty jak to możliwe.

Wystąpienie case 1 case 2 case 3 case 3 case 1 case 1 case 2 case 4 case 2 case 2 case 5 case 4 case 1 case 3 case 3 case 4 case 5 case 4 Zadanie task A task A task A task B task B task C task C task A task B task D task E task B task D task C task D task C task F task D Algorytm α Odkrywanie sekwencji w logu Sekwencje są projekcjami zdarzeń należących do tego samego wystąpienia case 1(Log) = ABCD case 2(Log) = ACBD ABCD cases: 1, 2, 3; razem (3) ACBD case: 4; razem (1) EF case: 5; razem (1)

Algorytm α Relacje występujące między zdarzeniami Bezpośrednie następstwo x>y jeżeli w logu istnieje sekwencja, w której zdarzenie x występuje bezpośrednio przed zdarzeniem y. Przyczynowość x y jeżeli istnieją sekwencje, w których występuje x>y, a nie ma sekwencji, w których występuje y>x. Współbieżność x y jeżeli istnieją sekwencje, w których występuje x>y i równocześnie istnieją wystąpienia procesów, w których występuje y>x Wybór x#y jeżeli w żadnej sekwencji nie ma przypadków x>y, ani y>x.

Algorytm α relacje między zdarzeniami Odkrywanie relacji między zdarzeniami Bezpośrednie następstwo: A>B, A>C, B>C, B>D, C>B, C>D, E>F Przyczynowość: A B, A C, B D, C D, E F Współbieżność: B C Wybór: ABCD ACBD EF A#D, A#E, A#F, B#E, B#F, C#E, C#F, D#E, D#F

Algorytm α reguły transformacji Wzorzec sekwencji x y x y

Algorytm α reguły transformacji wzorzec rozwidlenia AND x y, x z, and y z x y z

Algorytm α reguły transformacji wzorzec połączenia AND x z, y z, and x y x y z

Algorytm α reguły transformacji wzorzec rozwidlenia XOR x y, x z, and y#z x y z

Algorytm α reguły transformacji wzorzec połączenia XOR x z, y z, and x#y x y z

Algorytm α konstrukcja modelu Matryca zależności zdarzeń AND split AND join XOR join A B C D E F A # # # B # # C # # D # # # E # # # # F # # # # XOR split sekwencja

Case case 1 case 2 case 3 case 3 case 1 case 1 case 2 case 4 case 2 case 2 case 5 case 4 case 1 case 3 case 3 case 4 case 5 case 4 Task task A task A task A task B task B task C task C task A task B task D task E task C task D task C task D task B task F task D Wynik odkrywania modelu

Formalna definicja algorytmu α Niech W będzie logiem procesu zdefiniowanym na zbiorze elementarnych zadań T, σ jest dowolną sekwencją w tym logu. α(w) jest zdefiniowane następująco: 1. T W = { t T σ W t σ}, 2. T I = { t T σ W t = first(σ) }, 3. T O = { t T σ W t = last(σ) }, 4. X W = { (A,B) A T W B T W a A b B a W b a1,a2 A a 1 # W a 2 b1,b2 B b 1 # W b 2 }, 5. Y W = { (A,B) X (A,B ) X A A B B (A,B) = (A,B ) }, 6. P W = { p (A,B) (A,B) Y W } {i W,o W }, 7. F W = { (a,p (A,B) ) (A,B) Y W a A } { (p (A,B),b) (A,B) Y W b B } { (i W,t) t T I } { (t,o W ) t T O }, and 8. α(w) = (P W,T W,F W ).

Ograniczenia algorytmu Kompletność logów Poprawny model procesu możemy uzyskać, jedynie jeżeli log zawiera ślady wszystkich możliwych wystąpień procesu. Przykładowo, log pozwalający odtworzyć poniższy proces musi zawierać 10! różnych sekwencji. t1 ts t2 t10 tj Błędne zapisy w logu na poprawność modelu będą miały wpływ błędne informacje zapisane w logu. Rzadko występujące przypadki będą miały taki sam wpływ na kształt modelu jak częste przypadki.

Eksploracja zależności organizacyjnych Sekwencje znalezione w logu: id sekwencji zawartość sekwencji 1 Nowak(A), Kowalski(B), Tarzan(C), Nowak(D) 2 Nowak(A), Kowalski(B), Tarzan(C) 3 Buła(A), Frąckowiak(B), Tarzan(C) Aktywność wykonawców: Wykonawca A B C D Nowak 78% 12% Kowalski 81% Buła 22%

Sieć socjalna łącząca wykonawców Sieć socjalna zbudowana na podstawie przekazywania pracy w ramach procesów