Sieci Bayesa mgr Tomasz Xięski, Instytut Informatyki, Uniwersytet Śląski Sosnowiec, 2011

Podobne dokumenty
Gdzie: N zbiór wierzchołków grafu, E zbiór krawędzi grafu, Cp zbiór prawdopodobieostw warunkowych.

Systemy ekspertowe - wiedza niepewna

Algorytmy stochastyczne, wykład 08 Sieci bayesowskie

Rachunek prawdopodobieństwa Rozdział 3. Prawdopodobieństwo warunkowe i niezależność zdarzeń.

Klasyfikacja metodą Bayesa

Podstawy metod probabilistycznych. dr Adam Kiersztyn

Metody probabilistyczne

Wnioskowanie bayesowskie

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Rachunek prawdopodobieństwa

Statystyka Astronomiczna

Prawdopodobieństwo. Prawdopodobieństwo. Jacek Kłopotowski. Katedra Matematyki i Ekonomii Matematycznej SGH. 16 października 2018

P(F=1) F P(C1 = 1 F = 1) P(C1 = 1 F = 0) P(C2 = 1 F = 1) P(C2 = 1 F = 0) P(R = 1 C2 = 1) P(R = 1 C2 = 0)

Spacery losowe generowanie realizacji procesu losowego

Indukowane Reguły Decyzyjne I. Wykład 3

Podstawy Teorii Prawdopodobieństwa

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I (SGH)

5.1 Stopa Inflacji - Dyskonto odpowiadające sile nabywczej

Załącznik nr 8. do Studium Wykonalności projektu Sieć Szerokopasmowa Polski Wschodniej województwo podkarpackie

Matematyczne Podstawy Informatyki

Metody systemowe i decyzyjne w informatyce

Agnieszka Nowak Brzezińska Wykład III

Agata Boratyńska Statystyka aktuarialna... 1

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Elementy rachunku prawdopodobieństwa (M. Skośkiewicz, A. Siejka, K. Walczak, A. Szpakowska)

Sztuczna inteligencja : Tworzenie sieci Bayesa

Na podstawie: AIMA, ch13. Wojciech Jaśkowski. 15 marca 2013

Finanse dla sprytnych

Mariusz Próchniak Katedra Ekonomii II Szkoła Główna Handlowa w Warszawie WARTOŚĆ INFORMACJI. Ekonomia menedżerska

Rachunek prawdopodobieństwa dla informatyków

Matematyka finansowa r. Komisja Egzaminacyjna dla Aktuariuszy. XXXIII Egzamin dla Aktuariuszy - 11 października 2004 r.

Specyfikacja pó l deklaracji IFT-3/IFT-3R (07) wraz z załącznikami IFT/A

Zadanie 1. Ilość szkód N ma rozkład o prawdopodobieństwach spełniających zależność rekurencyjną:

Ćwiczenie 4 MS EXCEL. JEŻELI(test_logiczny;wartość_jeżeli_prawda;wartość_jeżeli_fałsz)

Sposoby prezentacji problemów w statystyce

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Elementy wspo łczesnej teorii inwersji

Zdarzenia losowe i prawdopodobieństwo

Zarządzanie projektami

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

+ r arcsin. M. Przybycień Rachunek prawdopodobieństwa i statystyka π r x

Agnieszka Nowak Brzezińska Wykład III

Opis przedmiotu. Karta przedmiotu - Probabilistyka I Katalog ECTS Politechniki Warszawskiej

Procedury środowiskowe jako sztuka podejmowania decyzji

MODELOWANIE STANÓW CZYNNOŚCIOWYCH W JĘZYKU SIECI BAYESOWSKICH

TEORIA GRAFÓW I SIECI

Matematyka ubezpieczeń majątkowych r.

18. Obliczyć. 9. Obliczyć iloczyn macierzy i. 10. Transponować macierz. 11. Transponować macierz. A następnie podać wymiar powstałej macierzy.

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Rachunek prawdopodobieństwa Rozdział 3. Prawdopodobieństwo warunkowe i niezależność zdarzeń.

Algorytmy Równoległe i Rozproszone Część X - Algorytmy samostabilizujące.

Dlaczego warto zarządzać projektem informatycznym

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Wymagania na poszczególne oceny szkolne z. matematyki. dla uczniów klasy IIIa i IIIb. Gimnazjum im. Jana Pawła II w Mętowie. w roku szkolnym 2015/2016

Tworzenie gier na urządzenia mobilne

TEORIA GRAFÓW I SIECI

Rachunek prawdopodobieństwa Rozdział 3. Prawdopodobieństwo warunkowe i niezależność zdarzeń.

Przestrzeń probabilistyczna

Inżynieria wiedzy Wnioskowanie oparte na wiedzy niepewnej Opracowane na podstawie materiałów dra Michała Berety

02DRAP - Aksjomatyczna definicja prawdopodobieństwa, zasada w-w

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova

Metody systemowe i decyzyjne w informatyce

Inżynieria oprogramowania. Część 8: Metoda szacowania ryzyka - PERT

Matematyka finansowa w pakiecie Matlab

Prawdopodobieństwo Warunkowe Prawdopodobieństwo Całkowite Niezależność Stochastyczna Zdarzeń

Teoretyczne podstawy informatyki

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Modelowanie Niepewności

p k (1 p) n k. k c. dokładnie 10 razy została wylosowana kula amarantowa, ale nie za pierwszym ani drugim razem;

Tomasz Tobiasz PLAN WYNIKOWY (zakres podstawowy)

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

1.2. Ostrosłupy. W tym temacie dowiesz się: jak obliczać długości odcinków zawartych w ostrosłupach, jakie są charakterystyczne kąty w ostrosłupach.

01. dla x 0; 1 2 wynosi:

Algorytmy klasyfikacji

Niepewność Belief Networks SE. Zarządzanie wiedzą. Wykład 9 Reprezentacja niepewności w systemach inteligentnych Probabilistyka. Joanna Kołodziejczyk

Sortowanie topologiczne skierowanych grafów acyklicznych

Reprezentacja niepewności w wiedzy w systemach ekspertowych

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Matematyka finansowa r. Komisja Egzaminacyjna dla Aktuariuszy. L Egzamin dla Aktuariuszy z 5 października 2009 r.

WYMAGANIA EDUKACYJNE

3.1 Analiza zysków i strat

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

DODATKOWA PULA ZADAŃ DO EGZAMINU. Rozważmy ciąg zdefiniowany tak: s 0 = a. s n+1 = 2s n +b (dla n=0,1,2 ) Pokaż, że s n = 2 n a +(2 n =1)b

Statystyka matematyczna

Metody systemowe i decyzyjne w informatyce

Scenariusz zajęć z przedmiotu podstawy przedsiębiorczości

Technikum Nr 2 im. gen. Mieczysława Smorawińskiego w Zespole Szkół Ekonomicznych w Kaliszu

KARTA KURSU. Probability theory

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Sztuczna inteligencja : Algorytm KNN

Sztuczna inteligencja : Zbiory rozmyte cz. III

STATYSTYKA MATEMATYCZNA WYKŁAD 1

Opis przedmiotu: Probabilistyka I

Rachunek prawdopodobieństwa- wykład 6

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Klasa II POTĘGI. Na ocenę dobrą: umie porównać potęgi sprowadzając do tej samej podstawy

c. dokładnie 10 razy została wylosowana kula antracytowa, ale nie za pierwszym ani drugim razem;

Transkrypt:

Sieci Bayesa mgr Tomasz Xięski, Instytut Informatyki, Uniwersytet Śląski Sosnowiec, 2011

Sieć Bayesowska służy do przedstawiania zależności pomiędzy zdarzeniami bazując na rachunku prawdopodobieństwa. Klasycznym przykładem jest reprezentowanie zależności pomiędzy symptomami a chorobą. Sieć Bayesa to skończony, acykliczny graf skierowany, zbudowany na podstawie prawdopodobieństw warunkowych (które są zawarte w zbiorze CP).

Sieć Bayesa to trójka: B = <N, E, Cp> Gdzie: N zbiór wierzchołków grafu E zbiór krawędzi grafu Cp zbiór prawdopodobieństw warunkowych. Wierzchołkami grafu są stwierdzenia lub hipotezy. Krawędzie grafu to relacje określające przejście od wierzchołka do wierzchołka z prawdopodobieństwem określającym to przejście.

Zbuduj Sieć Bayesa dla określonego zbioru Cp: P = {P(a), P(b a), P(c b), P(d b), P(G c), P(G d), P(e a), P(F e), P(F c)} Taki graf pozwala na prowadzenie wnioskowania w oparciu o prawdopodobieństwo i wzór Bayesa.

Prawdopodobieństwo łączne (całkowite) Jeśli zbiór podzielimy na zbiory B, ~B takie, że B ~B =, B ~B = ø i P(B) > 0 oraz P(~B) > 0, to dla dowolnego zdarzenia A prawdziwy jest wzór: P(A B) = P(A B)*P(B) + P(A ~B)*P(~B) gdzie: P(B) prawdopodobieństwo zajścia zdarzenia B P(~B) prawdopodobieństwo zajścia zdarzenia przeciwnego do B P(A B) prawdopodobieństwo (warunkowe) zajścia zdarzenia A pod warunkiem zajścia zdarzenia B. Jeśli zdarzenia A i B są niezależne wówczas prawdopodobieństwo łączne liczone jest ze wzoru: P(A B) =P(A)*P(B) Prawdopodobieństwo warunkowe (twierdzenie Bayesa lite)

Wiadomo, że test w 95% daje wynik negatywny jak dopingu nie brano. W 5% daje wynik pozytywny jeśli doping stosowano.

P(Test) = P(Test Dopping)*P(Dopping) + P(Test ~Dopping)*P~(~Dopping) = 0.98*0.5 + 0.05*0.5 = 0.49 + 0.025 = 0.515 ~= 0.52 Albo odwrotnie jeśli wiemy, że test dał wynik pozytywny to jakie jest podobieństwo, że używam doppingu? Wiadomo, że test w 95% daje wynik negatywny jak dopingu nie brano. W 5% daje wynik pozytywny jeśli doping stosowano.

Do modelowania i wnioskowania w sieciach Bayesa można wykorzystać oprogramowanie GeNIe: http://genie.sis.pitt.edu

Chance (szansa) przyjmują wartości dyskretne. Deterministic (deterministyczne) przyjmują wartości stałe, bądź wartość nominalną określoną przez użytkownika ze skończonego zbioru wartości. Equation (równanie) wyraża bardziej skomplikowane zależności miedzy zmiennymi, które należy poddać ocenie. Decision (decyzja) modeluje możliwe do podjęcia przez użytkownika decyzje. Value (wartość) modelują wartości powiązane z każdą możliwą do wykonania decyzją użytkownika. Submodel oznacza konceptualnie powiązaną grupę zmiennych.

Arc (łuk) umożliwia rysowanie połączeń między danymi wierzchołkami grafu. TextBox (pole tekstowe) umożliwia opis stworzonych sieci. Update (aktualizacja) dokonuje wyliczeń lub aktualizacji odpowiednich prawdopodobieństw w sieci Menu Node / View as umożliwia zmianę sposobu wyświetlania zaznaczonych węzłów sieci. Menu Node / Set Evidence określenie które zdarzenie miało miejsce.

Wyobraźmy sobie, że inwestor zastanawia się nad ryzykiem zainwestowania w nowo powstałą firmę. Źródłem niepewności jest tutaj sukces tej firmy. Inwestor jest świadom faktu, że tylko ok. 20% wszystkich nowopowstałych firm osiąga sukces. Tą niepewność można zmniejszyć pytając o zdanie eksperta. Przewidywania eksperta jednak nie zawsze się sprawdzają. Ekspert ocenia, że ze wszystkich firm które osiągają sukces 40% ma dobry pomysł na rozwój działalności, 40% ma średni pomysł, a 20% ma kiepski pomysł. Spośród wszystkich firm którym się nie udaje, ekspert wyznaczył, że 10% ma świetny pomysł, 30% ma niezły pomysł, a 60% ma kiepski pomysł. Załóżmy, że inwestor chce włożyć kwotę $5,000 w przedsięwzięcie. Wie on, że jeśli firma osiągnie sukces to zarobi na tym $10,000. Jeśli firma upadnie to straci on swój wkład $5,000, ale jeśli w ogóle nie zainwestuje, zyska $500 na bezpiecznej lokacie w banku. Co zrobić? Inwestować czy nie?

NIE! Lepiej dać na lokatę!

Proszę wykonać ćwiczenie znajdujące się pod adresem: http://tomaszx.pl/materialy/si_lab4_bayes2.pdf Kolejna porcja ćwiczeń znajduje się tu: http://tomaszx.pl/materialy/si_lab4_bayes.pdf Zadanie domowe: Proszę korzystając z programu GeNIe stworzyć sieć Bayesa na wymyślony przez Państwa temat (każdy inny) i przeprowadzić wnioskowanie.