Ústav teorie informace a automatizace. Tato prezentace je k dispozici na:

Podobne dokumenty
Edita Pelantová, katedra matematiky / 16

Numerické metody 8. května FJFI ČVUT v Praze

Úvodní informace. 18. února 2019

Linea rnı (ne)za vislost

Co nám prozradí derivace? 21. listopadu 2018

5. a 12. prosince 2018

Statistika (KMI/PSTAT)

1 Soustava lineárních rovnic

Matematika 2, vzorová písemka 1

Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

(1) Derivace. Kristýna Kuncová. Matematika B2 17/18. Kristýna Kuncová (1) Derivace 1 / 35

Funkce zadané implicitně. 4. března 2019

Inverzní Z-transformace

Kristýna Kuncová. Matematika B2

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Reprezentace dat. BI-PA1 Programování a Algoritmizace I. Ladislav Vagner

Cauchyova úloha pro obyčejnou diferenciální rovnici

Matematika (KMI/PMATE)

Aproximace funkcí 1,00 0,841 1,10 0,864 1,20 0,885. Body proložíme lomenou čarou.

Necht je funkce f spojitá v intervalu a, b a má derivaci v (a, b). Pak existuje bod ξ (a, b) tak, že f(b) f(a) b a. Geometricky

Numerické metody minimalizace

Kristýna Kuncová. Matematika B2 18/19. Kristýna Kuncová (1) Vzorové otázky 1 / 36

Logika V. RNDr. Kateřina Trlifajová PhD. Katedra teoretické informatiky Fakulta informačních technologíı BI-MLO, ZS 2011/12

MATEMATIKA 3. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Kapitola 4: Soustavy diferenciálních rovnic 1. řádu

Tabulky, součin tabulek

Euklidovský prostor. Funkce dvou proměnných: základní pojmy, limita a spojitost.

Statistika (KMI/PSTAT)

Kristýna Kuncová. Matematika B2 18/19

(2) Funkce. Kristýna Kuncová. Matematika B2. Kristýna Kuncová (2) Funkce 1 / 25

Komplexní analýza. Martin Bohata. Katedra matematiky FEL ČVUT v Praze Martin Bohata Komplexní analýza Mocninné řady 1 / 18

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Kombinatorika a grafy I

Průvodce studiem V této kapitole se budeme zabývat diferenciálním počtem pro funkce více

Stochastické modelování v ekonomii a financích Konzistence odhadu LWS. konzistence OLS odhadu. Předpoklady pro konzistenci LWS

Internetová matematická olympiáda 8. ročník, Baví se student Fakulty strojního inženýrství VUT v Brně (FSI) s kamarádem:

Tvarová optimalizace pro 3D kontaktní problém

Paradoxy geometrické pravděpodobnosti

Univerzita Palackého v Olomouci

Martin Pergel. 26. února Martin Pergel

Internet a zdroje. (Zdroje na Internetu) Mgr. Petr Jakubec. Katedra fyzikální chemie Univerzita Palackého v Olomouci Tř. 17.

Diferenciální rovnice základní pojmy. Rovnice se

Anna Kratochvílová Anna Kratochvílová (FJFI ČVUT) PDR ve zpracování obrazu / 17

Pracovní listy. Stereometrie hlavního textu

Laplaceova transformace

Komplexní analýza. Martin Bohata. Katedra matematiky FEL ČVUT v Praze Martin Bohata Komplexní analýza Úvod 1 / 32

Vybrané kapitoly z matematiky

Reprezentace a vyvozování znalostí

Reprezentace a vyvozování znalostí

Vybrané partie z kvantitativního řízení rizik - kreditní riziko

Design of Experiment (DOE) Petr Misák. Brno 2016

Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava

Operace s funkcemi [MA1-18:P2.1] funkční hodnota... y = f(x) (x argument)

Paralelní implementace a optimalizace metody BDDC

Stavový popis Stabilita spojitých systémů (K611MSAP) Katedra aplikované matematiky Fakulta dopravní ČVUT. čtvrtek 20. dubna 2006

Obsah. 1.2 Integrály typu ( ) R x, s αx+β

DFT. verze:

POLIURETANOWE SPRĘŻYNY NACISKOWE. POLYURETHANOVÉ TLAČNÉ PRUŽINY

Petr Beremlijski, Marie Sadowská

Reprezentace a vyvozování znalostí

Reprezentace a vyvozování znalostí.

MATEMATIKA 3 NUMERICKÉ METODY. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Powyższe reguły to tylko jedna z wersji gry. Istnieje wiele innych wariantów, można też ustalać własne zasady. Miłej zabawy!

Kristýna Kuncová. Matematika B3

Numerické metody a statistika

kontaktní modely (Winklerův, Pasternakův)

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. bankovnictví. Katedra pravděpodobnosti a matematické statistiky

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Bc. Hana Tritová. Katedra pravděpodobnosti a matematické statistiky

Základní elektrotechnická terminologie,

Ekonomicko-statistický návrh regulačního diagramu

Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) 3. listopadu Filip Železný (ČVUT) Vytěžování dat 3. listopadu / 1

GEM a soustavy lineárních rovnic, část 2

Poznámky k předmětu Statistika 3

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

Obsah. Limita posloupnosti a funkce. Petr Hasil. Limita posloupnosti. Pro a R definujeme: Je-li a < 0, pak a =, a ( ) =. vlastní body.

Teorie plasticity. Varianty teorie plasticity. Pružnoplastická matice tuhosti materiálu

Matematická statistika, statistická rozdělení a termodynamická limita

NDMI002 Diskrétní matematika

Matematika 1 Jiˇr ı Fiˇser 24. z aˇr ı 2013 Jiˇr ı Fiˇser (KMA, PˇrF UP Olomouc) KMA MAT1 24. z aˇr ı / 52

Metody, s nimiž se seznámíme v této kapitole, lze použít pro libovolnou

Elementární funkce. Edita Pelantová. únor FJFI, ČVUT v Praze. katedra matematiky, FJFI, ČVUT v Praze

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. rizik. Katedra pravděpodobnosti a matematické statistiky

Zaświadczenie. Nr 41/CB/2012. Niniejszym zaświadczam, iŝ Pan/Pani

Bezpłatny Internet dla mieszkańców Radomia zagrożonych wykluczeniem cyfrowym

7. Aplikace derivace

Automatové modely. Stefan Ratschan. Fakulta informačních technologíı. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Petr Hasil. c Petr Hasil (MUNI) Nekonečné řady MA III (M3100) 1 / 187

Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava

Lineární regrese. Skutečné regresní funkce nejsou nikdy lineární! regrese extrémně užitečná jak svou koncepcí, tak prakticky.

Jednoduchá zobrazení. Podpořeno z projektu FRVŠ 584/2011.

Přehled aplikací matematického programovaní a

Matematika III Stechiometrie stručný

PA152,Implementace databázových systémů 2 / 25

PARADIGMATA PROGRAMOVÁNÍ 1B

TGH01 - Algoritmizace

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Statistická mechanika. Prof. RNDr. Václav Janiš, DrSc.

Matematika prˇedna sˇka Lenka Prˇibylova 7. u nora 2007 c Lenka Prˇibylova, 200 7

Chyby, podmíněnost a stabilita

Transkrypt:

Aplikace bayesovských sítí Jiří Vomlel Ústav teorie informace a automatizace Akademie věd České republiky Tato prezentace je k dispozici na: http://www.utia.cas.cz/vomlel/

Obsah přednášky Podmíněná pravděpodobnost, Bayesův vzorec Nezávislost a podmíněná nezávislost Řetězcové pravidlo Definice bayesovské sítě Výhody reprezentace bayesovskou sítí Aplikace 1: modelování dědičných nemocí Aplikace 2: podpora rozhodování Aplikace 3: technická diagnostika Aplikace 4: adaptivní testování znalostí 2

Podmíněná pravděpodobnost Podmíněná pravděpodobnost veličiny A dáno veličina B je pravděpodobnostní distribuce P(A B) splňující vztah P(A B) P(B) = P(A, B). Jestliže P(B) je nenulové pak P(A B) = P(A,B) P(B). Například, mějme dvě binární veličiny: délka vlasů s hodnotami dlouhé a krátké pohlaví s hodnotami muž, žena P(muž dlouhé vlasy) = P(žena dlouhé vlasy) = P(muž, dlouhé vlasy) P(dlouhé vlasy) P(žena, dlouhé vlasy) P(dlouhé vlasy) 3

Bayesův vzorec P(A B) = P(A, B) P(B) = Například mějme dvě veličiny: P(B A) P(A) A P(A, B) = P(B A) P(A) A P(B A) P(A) R - Rain... v noci pršelo s hodnotami y = yes a n = no. W - Wet grass... tráva je mokrá s hodnotami y = yes a n = no. Víme, že: jestliže v noci pršelo pak je tráva mokrá s pravděpodobností 3 4, jestliže v noci nepršelo pak je tráva mokrá s pravděpodobností 1 8, pravděpodobnost, že bude v noci pršet je 1 3. Ráno vidíme, že tráva je mokrá. Jaká je pravděpodobnost, že v noci pršelo? 4

Bayesův vzorec P(R = y W = y) = P(W = y R = y) P(R = y) P(W = y R = y) P(R = y) + P(W = y R = n) P(R = n) = 3 4 13 3 4 13 + 1 8 23 = 1 4 1 4 + 12 1 = 1 4 4 12 = 3 4 Pravděpodobnost, že v noci pršelo je 3 4. 5

Nezávislost Pravděpodobnost společného výskytu hodnot veličin je rovna součinu pravděpodobností hodnot jednotlivých veličin. P(Dime = head, Penny = head) = P(Dime = head) P(Penny = head) Též, zjistíme-li hodnotu jedné veličiny, nemá to vliv na hodnotu druhé veličiny. P(Dime = head Penny = head) = P(Dime = head) 6

Náhodně vybereme jednu minci pro dva hody. První hod má vliv na pravděpodobnost výsledku druhého hodu. 7

Nyní, předpokládejme, že známe vybranou minci. Jestliže víme, která mince bude použita pak výsledek prvního hodu nemá vliv na pravděpodobnost výsledku druhého hodu. 8

Podmíněná nezávislost Pravděpodobnost společného výskytu hodnot veličin při dané hodnotě třetí veličiny je rovna součinu podmíněných pravděpodobností jednotlivých veličin dáno třetí veličina: P(First f lip = head, Second f lip = head Coin = dime) = P(First f lip = head Coin = dime) P(Second f lip = head Coin = dime) Jestliže neznáme minci, výsledek prvního hodu má vliv na pravděpodobnost výsledku druhého hodu. Jestliže známe minci, pak výsledek prvního hodu nemá vliv na pravděpodobnost výsledku druhého hodu. P(Second f lip = head Coin = dime, First f lip = head) = P(Second f lip = head Coin = dime) 9

Řetězcové pravidlo S definice podmíněné pravděpodobnosti plyne, že můžeme psát: P(A, B, C, D) = P(A B, C, D) P(B, C, D) = P(A B, C, D) P(B C, D) P(C, D) = P(A B, C, D) P(B C, D) P(C D) P(D) 10

Proč je Holmesův trávník mokrý? Holm Rn Sprnk Wat Je Holmesův trávník mokrý? Pršelo v noci? Byl Holmesův postřikovač zapnutý? Je Watsonův trávník mokrý? Holmesův trávník může být mokrý bud protože pršelo, nebo protože měl zapnutý postřikovač. Watsonův trávník může být mokrý protože pršelo. Holmesův postřikovač nemá vliv na Watsonův trávník. Déšt nesouvisí s tím, jestli má Holmes zapnutý postřikovač. Řetězcové pravidlo a podmíněné nezávislosti uvedené výše dávají: P(Holm, Wat, Rn, Sprnk) = P(Holm Wat, Rn, Sprnk) P(Wat Rn, Sprnk) P(Rn Sprnk) P(Sprnk) = P(Holm Rn, Sprnk) P(Wat Rn) P(Rn) P(Sprnk) 11

Proč je Holmesův trávník mokrý? P(Holm, Wat, Rn, Sprnk) = P(Holm Rn, Sprnk) P(Wat Rn) P(Rn) P(Sprnk) 12

Byl Holmesův postřikovač zapnutý? 13

Definice bayesovské sítě acyklický orientovaný graf (DAG) G = (V, E) každý uzel i V odpovídá jedné náhodné veličině X i s konečným počtem navzájem disjunktních hodnot X i pa(i) bude označovat množinu rodičů uzlu i v grafu G ke každému uzlu i V odpovídá podmíněná pravděpodobnostní distribuce P(X i (X j ) j pa(i) ) acyklický orientovaný graf (DAG) reprezentuje podmíněné nezávislostní vztahy mezi veličinami (X i ) i V 14

Výhoda reprezentace bayesovskou sítí Předpokládejme, že máme problém, který budeme modelovat pomocí n veličin a každá veličina může nabývat dvou hodnot. Použijeme-li representaci pomocí jedné tabulky potřebujeme pro uložení v paměti počítače distribuce 2 n 1 hodnot. Předpokládejme, bayesovskou sít mající též n veličin nabývajících dvou hodnot s grafem následující struktury: X 1 X 2 X 3 X n Pro její uložení v paměti počítače potřebujeme 1 + (n 1) 2 = 2n 1 hodnot. 15

Výhoda reprezentace bayesovskou sítí n 2 n 1 2n 1 2 3 3 3 7 5 4 15 7 10 1023 19 100 1.27 10 30 199 1000 1.07 10 301 1999 16

Aplikace 1: modelování dědičných nemocí 17

18

19

20

Aplikace 2: podpora rozhodování Cíl: maximalizace očekávaného užitku 21

22

23

24

Aplikace 3: Technická diagnostika - popis problému Příčiny problému (závady) C C. Akce A A - opravné kroky, které mohou odstranit závadu. Otázky Q Q - kroky, které mohou pomoci identifikovat, kde je závada. Ke každé akci i otázce je přiřazena cena (c A značí cenu akce A, c Q cenu otázky Q). Cena může znamenat: dobu potřebnou k provedení akce či otázky, cenu za náhradní díl, který použijeme rizikovost akce nějaká kombinace výše uvedených. 25

Trouble: světlý tisk. Příklad technické diagnostiky tiskárny Troubleshooter: doporučí kroky, které pomohou odstranit trouble Akce a otázky cena A 1 : Remove, shake and reseat toner 5 A 2 : Try another toner 15 A 3 : Cycle power 1 Q 1 : Is the printer configuration page printed light? 2 Možné závady při světlém tisku P(C i ) C 1 : Toner low 0.4 C 2 : Defective toner 0.3 C 3 : Corrupted dataflow 0.2 C 4 : Wrong driver setting 0.1 26

Light Print Problem - Bayesian Network Actions Causes A 1 Problem C 1 c 1 c 2 C 2 c 3 c 4 C 3 C 4 A 2 A 3 Questions Q 1 27

Světlý tisk - strategie odstranění závady A 1 = yes Q 1 = no A 1 = no Q 1 = yes A 2 = no A 2 = yes 28

Application 4: Adaptivní testování znalostí T 1 : ( 34 56 Příklady úloh: ) 1 8 = 15 24 1 8 = 5 8 1 8 = 4 8 = 1 2 T 2 : 1 6 + 1 12 = 2 12 + 1 12 = 3 12 = 1 4 1 T 3 : 4 1 2 1 = 1 4 32 = 3 8 ( T 4 : 12 12 ) ( 13 + 1 3) = 1 4 23 = 12 2 = 1 6. 29

Základní a operační dovednosti CP Porovnávání (spol. čitatel nebo jmenovatel) 1 2 > 1 3, 2 3 > 1 3 AD Sčítání (spol. jmenovatel) 1 7 + 2 7 = 1+2 7 = 3 7 SB Odečítání (spol. jmenovatel) 2 5 1 5 = 2 1 5 = 1 5 MT Násobení 1 2 35 = 3 CD Spol. jmenovatel ( 12, 2 3 ) CL Krácení 4 6 = 2 2 2 3 = 2 3 10 = ( 36, 4 6 ) CIM Konv. na slož. zlomek 7 2 = 3 2+1 2 = 3 1 2 CMI Konv. na nepravý zlomek 3 1 2 = 3 2+1 2 = 7 2 30

Špatné postupy Označení Popis Výskyt MAD MSB MMT1 MMT2 MMT3 MMT4 MC a b + d c = b+d a+c 14.8% a b d c = b d a c 9.4% a b a b a b a b cb = a c cb = a+c cd = a d cd = a c b 14.1% b b 8.1% b c 15.4% b+d 8.1% a b c = a b c 4.0% 31

Model studenta HV2 HV1 ACMI ACIM ACL ACD AD SB CMI CIM CL CD MT CP MAD MSB MC MMT1 MMT2 MMT3 MMT4 32

( 3 4 5 6 ) Model úlohy T1 1 8 = 15 24 1 8 = 5 8 1 8 = 4 8 = 1 2 T1 MT & CL & ACL & SB & MMT3 & MMT4 & MSB CL ACL MT SB MMT4 MSB T1 MMT3 P(X1 T1) X1 33

Model studenta spojený s modely otázek 34

Užitkovou funkcí je informační zisk Čím nižší je entropie, tím více o studentovi víme. H (P(X)) = x P(X = x) log P(X = x) 1 entropy 0.5 0 0 0.5 1 probability Informační zisk v uzlu n strategie IG(e n ) = H(P(S)) H(P(S e n )) 35

Skill Prediction Quality 92 90 adaptive average descending ascending 88 Quality of skill predictions 86 84 82 80 78 76 74 0 2 4 6 8 10 12 14 16 18 20 Number of answered questions 36