STOKŁOSA Józef 1 MARCINIAK Andrzej 2 Modelowanie ryzyka w transporcie WSTĘP Definiując wymagania stawiane systemom transportowym wyróżnia się między innymi takie ich cechy jak odporność (robustness) i zwinność (agility) i wymagania te transponuje się na problem zarządzania ryzykiem. Porządkowanie problematyki zarządzania ryzykiem, poprzez jej odpowiednią formalizację, wymaga modelowania ryzyka. Celem pracy jest sformułowanie założeń metodycznych dotyczących problemu modelowania ryzyka, skonstruowanie przykładowych modeli w oparciu o przyjęte założenia metodyczne i walidację ich funkcjonowania w oparciu o symulację komputerową. 1. ZAŁOŻENIA METODYCZNE KONSTRUOWANIA MODELI RYZYKA Podstawowym założeniem metodycznym jest widzenie modelu ryzyka, jako reprezentacji wiedzy o sytuacjach wystąpienia zagrożeń i racjonalnych na nie reakcjach. Pojęcie reprezentacja wiedzy jest tu rozumiane zgodnie z ontologiczną inżynierią wiedzy, to znaczy, jako zapis wiedzy w formalnym i wykonywalnym systemie symbolicznym (języku) [12]. Punktem wyjścia do konstruowania tak rozumianych modeli jest nieformalna konceptualizacja modelowanego problemu, tworzona w języku naturalnym przez ekspertów w danej dziedzinie problemowej. Taka nieformalna konceptualizacja jest następnie poddawana formalizacji przy użyciu narzędzi określanych jako edytory ontologii, np. system Protégé [7]. Produktem jest wówczas kod zapisany w języku OWL (Ontology Web Language) [8]. Wykonanie kodu OWL, np. w systemie Allegro [6], tworzy grafową, semantyczną bazę danych [3] [11], opisującą w tym przypadku rejestrowane wystąpienia zagrożeń, ich kontekst i dynamikę w zależności od podejmowanych działań profilaktycznych i interwencyjnych. Dane te są podstawą do budowy modeli zagrożeń poprzez zastosowanie algorytmów uczenia maszynowego. Natura zagrożeń wymaga włączenia w ich modele czynnika niepewności. Niepewność dotyczy zarówno szczegółowych informacji jak i wyników rozumowania w oparciu o te informacje. W tym celu można użyć prawdopodobieństwa jako miary niepewności. Wówczas zastosowany system reprezentacji wiedzy będzie systemem probabilistycznym, w którym pojęcie "wiedzieć" oznacza tyle, co "wiedzieć z dokładnością rozkładu prawdopodobieństwa". Metodą i technologią konstruowania takich modeli może być technologia sieci probabilistycznych, w szczególności sieci bayesowskich [2]. Otrzymywane w tej technologii modele są formalnymi i wykonywalnymi reprezentacjami wiedzy umożliwiającymi automatyczne wnioskowanie probabilistyczne zarówno predykcyjne jak i diagnostyczne. Komunikacja z taką reprezentacją wiedzy odbywa sie przez zadawanie pytań. 2. ELEMENTARNY MODEL RYZYKA Zgodnie z powszechnie przyjętą konceptualizacją ryzyko związane z określonym zagrożeniem ilościowo wyrażamy za pomocą prawdopodobieństwa wystąpienia zagrożenia i ilościowej miary konsekwencji tego zagrożenia. Tę konceptualizację uzupełniamy o pojęcie czynników wyzwalających lub sprzyjających zagrożeniu oraz pojęcia reprezentujące działania profilaktyczne mające na celu 1 Wyższa Szkoła Ekonomii i Innowacji, Wydział Transportu i Informatyki, 20-209 Lublin, ul. Projektowa 4. e-mail: jozef.stoklosa@wsei.lublin.pl 2 Wyższa Szkoła Ekonomii i Innowacji, Wydział Transportu i Informatyki, 20-209 Lublin, ul. Projektowa 4. e-mail: andrzej.marciniak@wsei.lublin.pl 6008
zmniejszenie prawdopodobieństwa wystąpienia zagrożenia i działania interwencyjne łagodzące skutki wystąpienia zagrożenia. Łuki grafu reprezentują relacje przyczynowe rys.1). Zagrożenie Inicjacja Wystąpienie zagrożenia Profilaktyka Interwencja Konsekwencje Rys.1. Graficzna reprezentacja pojęć i relacji międzypojęciowych użytych do konceptualizacji zagrożeń i związanego z nimi ryzyka Graf przedstawiony na rys.1 definiuje topologię sieci bayesowskiej będącej probabilistycznym modelem ryzyka [9], [10]. Węzły sieci reprezentują wówczas zmienne losowe, a łuki zależności przyczynowo-skutkowe między tymi zmiennymi. Z każdym węzłem związany jest warunkowy rozkład prawdopodobieństwa, a cała sieć opisuje łączny, sfaktoryzowany rozkład prawdopodobieństwa (rys.2). W przedstawionym tu modelu maksymalnie uproszczono zarówno topologię sieci jak i dziedziny zmiennych losowych. W praktycznych zastosowaniach każdy węzeł może być uszczegółowiony poprzez rozwinięcie go w subsieć, a sam moduł może być rozbudowywany poprzez konkatenację, np. w przypadku modelowania procesów lub pól losowych. Topologia wynika tutaj z przyjętej konceptualizacji ryzyka, natomiast warunkowe rozkłady prawdopodobieństwa muszą być wyznaczane i aktualizowane poprzez zastosowanie algorytmów uczenia z wykorzystaniem strumienia danym gromadzonych w celu dokumentowania procesów. Przedstawiony na rys. 2 model wykonano zgodnie z metodyką opracowaną przez Fentona i Neila [2] z wykorzystaniem programu AgenaRisk Lite [4]. Wnioskowanie probabilistyczne sprowadza się tu do wyznaczenia warunkowych rozkładów prawdopodobieństwa nad zmiennymi nieobserwowanymi pod warunkiem, że wartości zmiennych obserwowanych są zadane. Wyniki obserwacji mogą być twardymi (hard evidence) (zdarzenia z prawdopodobieństwem 1) lub miękkimi (soft evidence) faktami. Wnioskowanie może się odbywać zarówno w kierunku relacji przyczynowych jak i w kierunku odwrotnym. Na rys.3 przedstawiono przykład wnioskowania probabilistycznego użytego do porównania dwóch scenariuszy zagrożeń. 6009
Rys. 2. Sieć bayesowska reprezentująca minimalny model zagrożenia Scenariusz pierwszy - zagrożenie H1, czynniki sprzyjające - tak, profilaktyka - tak, działania interwencyjne - nie. Scenariusz drugi - zagrożenie H1, czynniki sprzyjające - tak, profilaktyka - nie, działania interwencyjne - nie. Pytamy o prawdopodobieństwo wystąpienia zagrożenia oraz jego skutki dla obu scenariuszy. Otrzymujemy odpowiedź z dokładnością do rozkładu prawdopodobieństwa (rys.3). 6010
Rys. 3. Wnioskowanie probabilistyczne 3. PRZYKŁAD: ZAGROŻENIE KOLIZJĄ NA PRZEJEŹDZIE KOLEJOWYM Czynnikami sprzyjającymi kolizji na przejeździe kolejowym typu A są: błąd niezamknięcia rogatek na czas przejazdu pociągu wynikający z: niedyspozycji dróżnika zawinionej lub niezawinionej, niewłaściwego zachowania się kierowców samochodów, błędna informacja przekazana dróżnikowi, niezadziałanie automatycznej sygnalizacji o zbliżającym sie pojeździe szynowym. Występujący w modelu węzeł reprezentujący czynniki sprzyjające jest fuzją wyżej wymienionych błędów. W szczególnym przypadku, gdy dziedziny zmiennych są tu binarne jest losową funkcją boolowską. Rozpatrujemy przykład, w którym działanie profilaktyczne ogranicza się do zmniejszenia liczby przejazdów kolejowych kolizyjnych. Do wyznaczenia apriorycznego prawdopodobieństwa wystąpienia kolizji wykorzystano dane o liczbie takich skrzyżowań i liczbie kolizji w 2011 r. Jako aprioryczny rozkład liczby kolizji przyjęto rozkład dwumianowy. 6011
Wówczas aprioryczne prawdopodobieństwo kolizji jest zmienną losową o rozkładzie beta i parametrach α, β. Uwzględnienie tej informacji w rozpatrywanym modelu pokazano na rys.4. Rys.4. Uczenie sieci - wyznaczanie prawdopodobieństwa kolizji Celem wnioskowania jest w tym przykładzie ocena zmniejszenia ryzyka wystąpienia kolizji poprzez zmniejszenie liczby przejazdów kolizyjnych. Wynik takiego wnioskowania pokazano na rys.5. Scenariusz pierwszy: dotyczy aktualnej liczby przejazdów kolizyjnych (n = 16400), a scenariusz dwa zakłada ich redukcję o 10%. 6012
Rys.5. Testowanie hipotez jako wnioskowanie probabilistyczne Z porównania scenariuszy wynika, że zmniejszenie liczby przejazdów kolizyjnych może skutkować zmniejszeniem liczby wypadków. Streszczenie Definiując wymagania, stawiane systemom transportowym, wyróżnia się między innymi, takie ich cechy, jak odporność (robustness) i zwinność (agility) i wymagania te transponuje się na problem zarządzania ryzykiem. Porządkowanie problematyki zarządzania ryzykiem, poprzez jej odpowiednią formalizację, wymaga modelowania ryzyka. W artykule przedstawiono metodę modelowania ryzyka w systemach transportowych opartą na technologii sieci bayesowskich i metodologię ontologicznej inżynierii wiedzy. Pokazany przykładowy model ryzyka jest dużym uproszczeniem rzeczywistego problemu. Tym niemniej, uniwersalność i ekspresywność zastosowanego języka modelowania jest oczywista. Risk modeling in transport system Abstract Basic requirements of the transport systems are robustness and agility. The robustness is defined as an ability of a system to resist change without adapting its initial stable configuration. The agility is defined as reliability and flexibility of the transport systems. In the paper a risk modeling in the transport system using bayesian technology and ontology knowledge has been presented. An example of the risk model, which is a simplified representation of real problem has been shown. BIBLIOGRAFIA 1. Christopher M. Bishop, Pattern Recognition and Machine Learning, Information Science and Statistics, Springer 2007 2. Fenton N., Neil M. Risk assessment and decision analysis with bayesian network. CRC Press, Taylor and Francis Group, 2013 3. Graph Databases by Ian Robinson, Jim Webber and Emil Eifrem, O Reily 2013 4. http://www.agenarisk.com 6013
5. http://dist.neo4j.org/basic-neo4j-co de-examples-2008-05-08.pdf - Neo. Some co de snipp ets, Emil Eifrem, 8.05.2008 r. 6. http://franz.com/agraph/support/documentation/current/agraph-introduction.html/ 7. http://protege.stanford.edu/ 8. http://www.w3.org/tr/2004/rec-owl-features-20040210/ 9. Pearl J. Causality. Models, reasoning, and inference. Cambridge University Press, Cambridge 2009 10. Pearl J. Probabilistic reasoning in inteligent systems: networks of plausible inference. Morgan Kaufmann Publishers, INnc, 1988 11. Pramod J. Sadalage, Martin Fowler, NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence, Addison-Wesley 2013 12. Sowa John F., Knowledge Representation: Logical, Philosophical, and Computational Foundations, Brooks Cole Publishing Co., Pacific Grove, CA, 2000. 6014