WPROWADZENIE DO SZTUCZNEJ INTELIGENCJI

Podobne dokumenty
WPROWADZENIE DO SZTUCZNEJ INTELIGENCJI

Wnioskowanie statystyczne i oparte na współczynnikach wiarygodności

Wnioskowanie statystyczne i oparte na współczynnikach wiarygodności. Wprowadzenie teoretyczne Wnioskowanie probabilistyczne Przykłady

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Wnioskowanie statystyczne i oparte na współczynnikach wiarygodności

STATYSTYKA MATEMATYCZNA

Testowanie hipotez statystycznych

Modelowanie Niepewności

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Na podstawie: AIMA, ch13. Wojciech Jaśkowski. 15 marca 2013

Statystyka matematyczna dla kierunku Rolnictwo w SGGW. BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH. ANALIZA KORELACJI PROSTEJ.

Programowanie deklaratywne

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Po co nam statystyka matematyczna? Żeby na podstawie próby wnioskować o całej populacji

SZTUCZNA INTELIGENCJA

Fuzja sygnałów i filtry bayesowskie

Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka

Weryfikacja hipotez statystycznych

Definicje. Najprostszy schemat blokowy. Schemat dokładniejszy

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Najprostszy schemat blokowy

Drzewa Decyzyjne, cz.2

Najprostsze modele sieci z rekurencją. sieci Hopfielda; sieci uczone regułą Hebba; sieć Hamminga;

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Technologia informacyjna

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Bardzo formalny, odbiorca posiada specjalny tytuł, który jest używany zamiast nazwiska

Układy równań liniowych. Ax = b (1)

2. Empiryczna wersja klasyfikatora bayesowskiego

Wnioskowanie bayesowskie

1.UKŁADY RÓWNAŃ LINIOWYCH

WyŜsza Szkoła Zarządzania Ochroną Pracy MS EXCEL CZ.2

Instrukcja warunkowa i złoŝona.

Instrukcja zarządzania kontami i prawami

Wykład 5. Cel wykładu. Korespondencja seryjna. WyŜsza Szkoła MenedŜerska w Legnicy. Informatyka w zarządzaniu Zarządzanie, zaoczne, sem.

Wstęp INFORMATOR TECHNICZNY WONDERWARE. Wysyłanie wiadomości z programu Wonderware Historian. 1. Aktywowanie Database Mail

Metody systemowe i decyzyjne w informatyce

Statystyka matematyczna i ekonometria

Elementy modelowania matematycznego

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Metody systemowe i decyzyjne w informatyce

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

XII. Warunek wielokrotnego wyboru switch... case

Systemy ekspertowe - wiedza niepewna

Analiza danych. TEMATYKA PRZEDMIOTU

Wyszukiwanie. Wyszukiwanie binarne

Matematyka i statystyka matematyczna dla rolników w SGGW

166 Wstęp do statystyki matematycznej

Sympozjum Trwałość Budowli

Inżynieria Wiedzy i Systemy Ekspertowe. Niepewność wiedzy. dr inż. Michał Bereta Politechnika Krakowska

SPAM studium przypadku

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

MODELOWANIE PROCESU EKSPLOATACJI OBIEKTÓW TECHNICZNYCH ZA POMOCĄ DYNAMICZNYCH SIECI BAYESOWSKICH

STATYSTYKA MATEMATYCZNA

2. Lesław Gajek, Marek Kałuszka, Wnioskowanie statystyczne. Modele i metody. Dla studentów.

( 2) 6 III EDYCJA MIĘDZYSZKOLNEGO KONKURSU MATEMATYCZNEGO DLA UCZNIÓW SZKÓŁ PONADGIMNAZJALNYCH O PROFILU ZAWODOWYM I TECHNICZNYM.

KARTA KURSU. Probability theory

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Hipotezy statystyczne

Wymagania edukacyjne z matematyki w klasie III gimnazjum

FK - Deklaracje CIT-8

Agata Boratyńska Statystyka aktuarialna... 1

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka matematyczna i ekonometria

Wykład 2. Zdarzenia niezależne i prawdopodobieństwo całkowite

Wykład 2. Przykład zastosowania teorii prawdopodobieństwa: procesy stochastyczne (Markova)

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

POWSZECHNE KRAJOWE ZASADY WYCENY (PKZW)

Definicja pochodnej cząstkowej

KLUCZ ODPOWIEDZI POPRAWNA ODPOWIEDŹ 1 D 2 C 3 C 4 B 5 D 6 A 7 D 8 D 9 A 10 C 11 B 12 A 13 A 14 B 15 D 16 B 17 C 18 A 19 B 20 D

Typowe błędy w analizie rynku nieruchomości przy uŝyciu metod statystycznych

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza

Własności statystyczne regresji liniowej. Wykład 4

V. WYMAGANIA EGZAMINACYJNE

Statystyka matematyczna dla leśników

Algorytmy stochastyczne, wykład 08 Sieci bayesowskie

Wstęp do rachunku prawdopodobieństwa. Cz. 1 / William Feller. wyd. 6, dodr. 4. Warszawa, Spis treści

Internet wyszukiwarki internetowe

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Algorytmy estymacji stanu (filtry)

Teoria błędów pomiarów geodezyjnych

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Wymagania dla klasy szóstej Treści na 2 na 3 na 4 na 5 na 6 Uczeń: Uczeń: Uczeń: Uczeń: Uczeń: Mnożenie ułamków zwykłych

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

PRZEWODNIK PO SERWISIE BRe BROKERS Rozdział 3

Rachunek Prawdopodobieństwa Anna Janicka

Hipotezy statystyczne

klasa III technikum I. FIGURY I PRZEKSZTAŁCENIA Wiadomości i umiejętności

Testowanie hipotez statystycznych.

Teoria automatów i języków formalnych. Określenie relacji

Rozkład materiału nauczania

Transkrypt:

OLITECHNIKA WARSZAWSKA WYDZIAŁ MECHANICZNY ENERGETYKI I LOTNICTWA MEL WROWADZENIE DO SZTUCZNEJ INTELIGENCJI NS 586 Dr inŝ. Franciszek Dul

oziomy sztucznej inteligencji Sztuczna świadomość? Uczenie się lanowanie i podejmowanie decyzji Niepewność Wnioskowanie logiczne Rozwiązywanie problemów

13. NIEEWNOŚĆ

Niepewność okaŝemy, co powinien zrobić agent gdy nie wszystko jest dla niego oczywiste.

Jak uwzględniać niepewność? Agent logiczny moŝe uŝyć swej wiedzy i umiejętności wnioskowania do wypracowania decyzji. Jednak obraz świata jaki ma agent prawie zawsze cechuje się niepewnością. Czysto logiczne decyzje agenta mogą zatem być nieoptymalne lub nawet błędne. Agent potrzebuje więc narzędzia umoŝliwiającego uwzględnianie swojej niewiedzy, ignorancji lub nawet lenistwa. MoŜliwość taką daje podejście probabilistyczne oparte na rachunku prawdopodobieństwa. Agent probabilistyczny potrafi podejmować decyzje w sytuacji, w której agent logiczny jest bezradny.

13.1. Działanie w warunkach niepewności Jak stwierdzić, kiedy działanie A t wyjazd na lotnisko t minut przed odlotem zapewni osiągnięcie celu dojazd na czas? roblemy: częściowa obserwowalność (natęŝenie ruchu, stan dróg, plany innych kierowców, etc.), błędy pomiarów (odległości, prędkości), niesprawności czujników (np. prędkościomierza), niepewność rezultatu działania (złapanie gumy, wypadek), ogromna złoŝoność modelowania i przewidywania ruchu. odejście czysto logiczne nie jest wystarczające: działanie A 25 zapewni dojazd na czas jest ryzykowne; wnioskowanie logiczne jest za słabe - nie umoŝliwia podjęcie racjonalnej decyzji: A 25 zapewni dojazd na czas jeŝeli nie będzie wypadku, nie będzie padało, nie pęknie koło,... A 1440 prawie na pewno zapewni dojazd na czas, ale trzeba by było czekać całą noc na lotnisku.

13.1. Działanie w warunkach niepewności Sposoby uwzględniania niepewności Logika domyślna lub niemonotoniczna: Wnioskowanie na temat niezaobserwowanych faktów, np.: zakładam, Ŝe w moim samochodzie koło nie pęknie; Logika rozmyta (fuzzy logic): UmoŜliwia opis stopnia prawdziwości faktów, np. Wzrost(Jan) = 190cm Wysoki(Jan) = 1.0; Wzrost(Adam) = 160cm Wysoki(Adam) = 0.2; rawdopodobieństwo: WyraŜa stopień wiary w prawdziwość faktów Działanie A 25 zapewni dojazd na czas z prawdopodobieństwem 0.04. odejście probabilistyczne uwzględnia efekty: ignorancji: brak jest adekwatnych modeli zjawisk. braku danych: brak informacji o warunkach zjawiska, lenistwa: nie chce nam się dokładnie analizować sytuacji, albo jest to zbyt kosztowne; W podejściu probabilistycznym nie czyni się załoŝeń a priori o świecie.

13.1. Działanie w warunkach niepewności odejmowanie decyzji w warunkach niepewności ZałóŜmy, Ŝe prawdopodobieństwa działań są następujące: (A 25 zapewni dojazd na czas ) = 0.04 (A 90 zapewni dojazd na czas ) = 0.70 (A 1440 zapewni dojazd na czas ) = 0.9999 Które działanie jest racjonalne? ZaleŜy to od preferencji agenta zaleŝnej np. od wagi spóźnienia się na samolot, czasu oczekiwania, etc. Do reprezentowania preferencji słuŝy teoria uŝyteczności. W połączeniu z teorią prawdopodobieństwa tworzy ona teorię podejmowania decyzji Teoria podejmowania decyzji = = teoria uŝyteczności + teoria prawdopodobieństwa

13.2. Składnia rachunku prawdopodobieństwa Element podstawowy zmienna losowa (random variable) opisuje jakiś aspekt (niepewnego) świata. Zmienne losowe mogą być: boolowskie, np. Ubytek z dziedziną prawda, fałsz, dyskretne, np. ogoda, która ma dziedzinę słoneczna, deszczowa, pochmurna, śnieŝna ciągłe, np. Wzrost, która ma dziedzinę [0, ]. Twierdzenia elementarne są konstruowane poprzez przypisanie zmiennym losowym wartości z dziedziny, np.: ogoda = słoneczna, (w skrócie: słoneczna ) Ubytek = fałsz (w skrócie: ubytek ) Twierdzenia złoŝone formułuje się z twierdzeń elementarnych za pomocą operatorów logicznych, np. ogoda = słoneczna Ubytek = fałsz

13.2. Składnia rachunku prawdopodobieństwa Zdarzenie elementarne (atomic event) kaŝda moŝliwa kombinacja wartości z dziedziny zmiennych losowych. rzykład JeŜeli jakiś fragment świata opisany jest dwiema zmiennymi boolowskimi: Ubytek, ólzęba to istnieją cztery róŝne zdarzenia elementarne: Ubytek = fałsz ólzęba = fałsz Ubytek = fałsz ólzęba = prawda Ubytek = prawda ólzęba = fałsz Ubytek = prawda ólzęba = prawda Zdarzenia elementarne: wykluczają się wzajemnie, są kompletne pokrywają całą dziedzinę.

rawdopodobieństwo wyraŝa stopień wiary w prawdziwość faktów (stopień przekonania o ich prawdziwości). Aksjomaty prawdopodobieństwa Aksjomaty Kołmogorowa: dla kaŝdych twierdzeń A i : 0 (A) 1, rawda A (prawda) = 1 i (fałsz) = 0, (A ) = (A) + () - (A ). Aksjomaty te pozwalają zbudować całą teorię prawdopodobieństwa. NajwaŜniejsze wnioski z aksjomatów Kołmogorowa: ( A) = 1 - (A), JeŜeli dziedziną zmiennej D jest d 1, d 2,..., d n, to n i = 1 ( D = di ) = 1 A rawdopodobieństwo twierdzenia jest równe sumie prawdopodobieństw zdarzeń elementarnych dla których jest ono prawdziwe, tj. ( a) = e i e( a) ( e i )

13.2. Składnia rachunku prawdopodobieństwa rawdopodobieństwo a priori (prior probability) rawdopodobieństwo a priori zdarzenia (zwane takŝe prawdopodobieństwem bezwarunkowym) opisuje stopień wiary w wystąpienie zdarzenia przed pojawieniem się nowych danych. (Ubytek=prawda) = 0.1, (ogoda=słoneczna) = 0.72 Rozkład prawdopodobieństwa określa wartości prawdopodobieństw dla wszystkich zdarzeń elementarnych, np.: (ogoda) = 0.72, 0.1, 0.08, 0.1 (Znormalizowane, tj., Σ =1) Rozkład łączny prawdopodobieństwa dla zbioru zmiennych losowych określa prawdopodobieństwa wszystkich zdarzeń elementarnych, np. (ogoda,ubytek) = macierz 2 4 wartości prawdopodobieństw. ogoda= słoneczna deszczowa pochmurna śnieŝna Ubytek=prawda 0.144 0.02 0.016 0.02 Ubytek=fałsz 0.576 0.08 0.064 0.08 rawdopodobieństwo łączne pozwala odpowiedzieć na kaŝde pytanie dotyczące dziedziny opisywanej przez zmienne losowe.

13.2. Składnia rachunku prawdopodobieństwa rawdopodobieństwo warunkowe Sposób wnioskowania probabilistycznego uwarunkowany jest wiedzą posiadaną na temat dziedziny. rawdopodobieństwo a posteriori (prawdopodobieństwo warunkowe) określa wiarygodność zdarzenia przy załoŝeniu, Ŝe zaszło inne zdarzenie. rzykład (ubytek bólzęba) = 0.8 (tj., wiadomo, Ŝe ólzęba = prawda) JeŜeli jednak wiadomo, Ŝe Ubytek = prawda, to (ubytek bólzęba, ubytek) = 1.0 Niektóre dane mogą nie mieć znaczenia, co pozwala upraszczać wyraŝenia, np. (ubytek bólzęba, słoneczna) = (ubytek bólzęba) = 0.8.

13.2. Składnia rachunku prawdopodobieństwa Definicja prawdopodobieństwa warunkowego (a b) = (a b) / (b) jeŝeli (b) > 0. Definicja równowaŝna wykorzystująca regułę iloczynu (a b) = (a b) (b) = (b a) (a). Dla rozkładu prawdopodobieństwa mamy np. (ogoda,ubytek) = (ogoda Ubytek) (Ubytek). oprzez kolejne stosowanie reguły iloczynu otrzymuje się regułę łańcuchową, (X 1,,X n ) = (X 1,...,X n-1 ) (X n X 1,...,X n-1 ) = (X 1,...,X n-2 ) (X n-1 X 1,...,X n-2 ) (X n X 1,...,X n-1 ) = = i=1,n (X i X 1,,X i-1 )

Wnioskowanie z niepewnością odstawowy rodzajem wnioskowania probabilistycznego jest wnioskowanie na podstawie rozkładu łącznego prawdopodobieństwa. JeŜeli znamy rozkład łączny prawdopodobieństwa, to jesteśmy w stanie odpowiedzieć na kaŝde pytanie dotyczące zdarzeń z dziedziny opisanej tym rozkładem.

13.4. Wnioskowanie z rozkładu łącznego Zasada: obliczanie rozkładu prawdopodobieństwa dla zdania f przez ustalenie wartości prawdopodobieństw zmiennych jawnych i sumowanie prawdopodobieństw zmiennych ukrytych. roblem opisany jest trzema zmiennymi losowymi: Ubytek, ólzęba, Wykrycie. Wykorzystujemy rozkład prawdopodobieństwa łącznego bólzęba bólzęba wykrycie wykrycie wykrycie wykrycie ubytek 0.108 0.012 0.072 0.008 ubytek 0.016 0.064 0.144 0.576 Dodajemy prawdopodobieństwa tych zdarzeń elementarnych z które są prawdziwe w zdaniu f, (f) = Σ z (z)

13.4. Wnioskowanie z rozkładu łącznego Zasada: obliczanie rozkładu prawdopodobieństwa dla zdania f przez ustalenie wartości prawdopodobieństw zmiennych jawnych i sumowanie prawdopodobieństw zmiennych ukrytych. roblem opisany jest trzema zmiennymi losowymi: Ubytek, ólzęba, Wykrycie. Wykorzystujemy rozkład prawdopodobieństwa łącznego bólzęba bólzęba wykrycie wykrycie wykrycie wykrycie ubytek 0.108 0.012 0.072 0.008 ubytek 0.016 0.064 0.144 0.576 Dodajemy prawdopodobieństwa tych zdarzeń elementarnych z które są prawdziwe w zdaniu f, (f) = Σ z (z) rzykład (bólzęba) = 0.108 + 0.012 + 0.016 + 0.064 = 0.2

13.4. Wnioskowanie z rozkładu łącznego Zasada: obliczanie rozkładu prawdopodobieństwa dla zdania f przez ustalenie wartości prawdopodobieństw zmiennych jawnych i sumowanie prawdopodobieństw zmiennych ukrytych. roblem opisany jest trzema zmiennymi losowymi: Ubytek, ólzęba, Wykrycie. Wykorzystujemy rozkład prawdopodobieństwa łącznego bólzęba bólzęba wykrycie wykrycie wykrycie wykrycie ubytek 0.108 0.012 0.072 0.008 ubytek 0.016 0.064 0.144 0.576 Dodajemy prawdopodobieństwa tych zdarzeń elementarnych z które są prawdziwe w zdaniu f, (f) = Σ z (z) rzykład (ubytek bólzęba) = 0.108 + 0.012 + 0.072 + 0.008 + 0.016 + 0.064 = 0.28

13.4. Wnioskowanie z rozkładu łącznego Zasada: obliczanie rozkładu prawdopodobieństwa dla zdania f przez ustalenie wartości prawdopodobieństw zmiennych jawnych i sumowanie prawdopodobieństw zmiennych ukrytych. roblem opisany jest trzema zmiennymi losowymi: Ubytek, ólzęba, Wykrycie. Wykorzystujemy rozkład prawdopodobieństwa łącznego bólzęba bólzęba wykrycie wykrycie wykrycie wykrycie ubytek 0.108 0.012 0.072 0.008 ubytek 0.016 0.064 0.144 0.576 W taki sposób moŝna takŝe wyznaczać prawdopodobieństwo warunkowe ( ubytek bólzęba) = ( ubytek bólzęba) / (bólzęba) = ( 0.016 + 0.064 ) / / ( 0.108 + 0.012 + 0.016 + 0.064 ) = 0.08 / 0.2 = 0.4

13.4. Wnioskowanie z rozkładu łącznego Wnioskowanie na podstawie rozkładu łącznego NaleŜy wyznaczyć rozkład prawdopodobieństwa łącznego zmiennych losowych X stanowiących zapytania na podstawie znanych wartości e zmiennych losowych danych E. Rozkład prawdopodobieństwa łącznego (X E=e) otrzymuje się poprzez sumowanie elementów rozkładu łącznego względem wszystkich zmiennych losowych ukrytych H = X - E (X E=e) = α (X,E=e) = α Σ h (X,E=e,H=h) gdzie α jest stałą normującą, α = 1/Σ (E) (odwrotność mianownika wzoru dla prawdopodobieństwa warunkowego). Koszt (d liczba wartości zmiennej losowej, n liczba zmiennych losowych): w najgorszym przypadku czas obliczeń jest wykładniczy ~O(d n ), pamięć potrzebna do przechowania rozkładu łącznego ~O(d n ). oniewaŝ wyznaczenie d n wartości rozkładu łącznego jest bardzo kosztowne, to jego uŝycie nie jest moŝliwe w przypadku większej liczby zmiennych losowych.

NiezaleŜność zdarzeń Gdyby wszystkie zdarzenia w świecie były zaleŝne, to wnioskowanie probabilistyczne musiałoby być prowadzone na podstawie rozkładu łącznego prawdopodobieństwa. Wymagałoby to bardzo długich czasów obliczeń, co wręcz uniemoŝliwiałoby wnioskowanie. Na szczęście zdarzenia w świecie są często niezaleŝne lub zaleŝne warunkowo. UmoŜliwia to ich osobną analizę, a w rezultacie znaczne uproszczenie wnioskowania statystycznego.

13.5. NiezaleŜność zdarzeń Zdarzenia A i są niezaleŝne wtedy i tylko wtedy gdy (A ) = (A) lub ( A) = () lub (A,) = (A)() rzykład Dekompozycja zdarzeń niezaleŝnych Ubytek ólzęba Wykrycie ogoda Dekompozycja Ubytek ólzęba Wykrycie ogoda (ólzęba,ubytek,wykrycie,ogoda) = = (ólzęba,ubytek, Wykrycie) (ogoda) Dekompozycja pozwala zmniejszyć liczbę elementów rozkładu prawdopodobieństwa łącznego z 32 do 12. Całkowita niezaleŝność zdarzeń jest jednak rzadkością. Zagadnienia rzeczywiste (np. medyczne) opisywane są duŝą liczbą zmiennych które najczęściej są zaleŝne.

13.5. NiezaleŜność zdarzeń NiezaleŜność warunkowa Zdarzenia X i Y mogą być zaleŝne, ale jednocześnie niezaleŝne warunkowo przy danej wartości zmiennej Z. rzykład Wykrycie ubytku jest niezaleŝne od bólu zęba, (wykrycie bólzęba,ubytek) = (wykrycie ubytek) Wykrycie braku ubytku równieŝ nie zaleŝy od bólu zęba, (wykrycie bólzęba, ubytek) = (wykrycie ubytek) Zmienna Wykrycie jest niezaleŝna na warunkowo od zmiennej ólzęba przy danej wartości zmiennej Ubytek, (Wykrycie ólzęba,ubytek) = (Wykrycie Ubytek) Definicja niezaleŝności warunkowej zmiennych X i Y przy danej zmiennej Z (X,Y Z ) = (X Z ) (Y Z ) Rozkład prawdopodobieństwa zdarzeń niezaleŝnych warunkowo jest iloczynem rozkładów skutków przy danej przyczynie.

13.5. NiezaleŜność zdarzeń NiezaleŜność warunkowa pozwala zazwyczaj radykalnie zmniejszyć rozmiar rozkładu łącznego prawdopodobieństwa z wykładniczego O(d n ) do liniowego O(n). rzykład Rozkład prawdopodobieństwa łącznego dla problemu stomatologicznego jest równy (ólzęba,wykrycie,ubytek) = (ólzęba,wykrycie Ubytek) (Ubytek) Z niezaleŝności no warunkowej bólu zęba i wykrycia wynika, Ŝe: (ólzęba, Wykrycie Ubytek) = = (ólzęba Ubytek) (Wykrycie Ubytek) Rozkład prawdopodobieństwa łącznego jest zatem równy (ólzęba,wykrycie,ubytek) = = (ólzęba Ubytek) (Wykrycie Ubytek) (Ubytek) NiezaleŜność warunkowa jest najbardziej przydatnym rodzajem informacji w przypadku, gdy środowisko jest niepewne.

13.6. Reguła ayesa Korzystając z reguły iloczynu (a b) = (a b)(b) = (b a)(a) otrzymuje się regułę ayesa ( a b) = ( b a) ( a) ( b) Reguła ayesa dla rozkładu prawdopodobieństwa Thomas ayes 1702-1761 ( X Y ) ( Y ) ( Y X ) = = α ( X Y ) ( Y ) ( X ) Reguła ayesa pozwala wyznaczyć odwrócone przyczynowo rozkłady prawdopodobieństwa. Reguła ayesa jest bardzo uŝyteczna dla oceny prawdopodobieństwa diagnostycznego na podstawie prawdopodobieństwa przyczynowego (Skutek rzyczyna) (rzyczyna) (rzyczyna Skutek) = (Skutek)

13.6. Reguła ayesa rzykład Ubytek ólzęba Wykrycie rzy niezaleŝności warunkowej zmiennych ólzęba oraz Wykrycie przy danej wartości zmiennej Ubytek otrzymujemy (Ubytek bólzęba wykrycie) = = α (bólzęba wykrycie Ubytek) (Ubytek) = α (bólzęba Ubytek) (wykrycie Ubytek) (Ubytek)

13.6. Reguła ayesa Naiwny model ayesa NiezaleŜność warunkową zdarzeń wykorzystuje się w tzw. naiwnym modelu ayesa, w którym zakłada sięŝe zdarzenia są niezaleŝne. rzyczyna Skutek 1... Skutek n Rozkład łączny prawdopodobieństwa jest równy (rzyczyna,skutek 1,,Skutek n ) = = (rzyczyna) i, (Skutek i rzyczyna) Naiwny model ayesa w praktyce często prowadzi do bardzo dobrych wyników mimo iŝ zdarzenia są zazwyczaj zaleŝne.

Kiedy wnioskowanie stochastyczne jest niezastąpione? Jest tak wtedy, gdy nie ma adekwatnego modelu świata, gdy wiedza agenta jest niepełna lub gdy nie jest on w stanie dokonać analizy wielu złoŝonych zaleŝności. rzykładem takiej sytuacji w świecie Wumpusa jest stan w którym agent nie moŝe wywnioskować logicznie, jakie działanie jest bezpieczne. Z pomocą przychodzi wtedy wnioskowanie probabilistyczne.

13.7. Wnioskowanie statystyczne w świecie Wumpusa rzykład sytuacji, w której wnioskowanie statystyczne jest lepsze niŝ logiczne wnioskowanie deterministyczne. Sytuacja w świecie Wumpusa (w tym przykładzie zakładamy, Ŝe nie ma Wumpusa i złota) : 1,1 1,2 2,1 1,2 2,1 Doły mogą znajdować się więc w polach (1,3), (2,2) lub (3,1). Wnioskowanie deterministyczne? (logiczne) nie powie jednak agentowi, na które z tych pól moŝe się bezpiecznie przemieścić. Obserwacje agenta są lokalne, więc informacja którą posiada o środowisku jest niepełna. Wnioskowanie statystyczne pozwoli jednak stwierdzić, które pole jest najbezpieczniejsze (chociaŝ bez gwarancji!). otrzebne są jednak dodatkowe informacje lub hipotezy.?? A???

13.7. Wnioskowanie statystyczne w świecie Wumpusa Opis probabilistyczny Zmienne losowe: i,j - zmienna logiczna równa 1 gdy w polu (i,j) jest dół; - zmienna logiczna równa 1 gdy w polu (i,j) wieje wiatr. i,j Hipoteza statystyczna: Rozkład dołów jest równomierny. rawdopodobieństwo dołu w polu (i,j) Fakty (obserwacje): ( i,j =1) = 0.2, ( i,j =0) = 1 - ( i,j =1) = 0.8. znane = 1,1 1,2 2,1 b = 1,1 1,2 2,1 ytania: ( 1,3 znane,b) = ( 3,1 znane,b) =?, ( 2,2 znane,b) =? Rozkład łączny prawdopodobieństwa: ( 1,1,, 4,4, 1,1, 1,2, 2,1 ) = = ( 1,1, 1,2, 2,1 1,1,, 4,4 ) ( 1,1,, 4,4 ) Liczba pól niewiadomych = 12 liczba wyrazów = 2 12 = 4096

13.7. Wnioskowanie statystyczne w świecie Wumpusa Analiza zaleŝności zjawisk pozwala zmniejszyć liczbę potrzebnych wyrazów rozkładu łącznego do dziesięciu. Z reguły ayesa prawdopodobieństwo warunkowe dołu w polach (1,3) lub (3,1) jest równe ( 1,3 znane,b) = α ( 1,3 ) Σ granica (b znane, 1,3,granica) (granica) Dla kaŝdej wartości 1,3 wykonujemy sumowanie względem moŝliwych wystąpień dołów w polach granicy rawdopodobieństwo dołu w polu (1,3) jest równe ( 1,3 znane,b) = 0.31, 0.69 rawdopodobieństwo dołu w polu (2,2) jest równe ( 2,2 znane,b) = 0.86, 0.13

13.7. Wnioskowanie statystyczne w świecie Wumpusa rawdopodobieństwo dołu w polu (2,2) jest więc znacznie większe niŝ w polach (1,3) lub (3,1). 0.31 0.86 Agent powinien więc unikać pola (2,2)! A 0.31 Wnioskowanie statystyczne pozwoliło zatem (przy dodatkowym załoŝeniu dotyczącym rozkładu dołów) uzyskać bardziej przydatne wyniki niŝ otrzymane z wnioskowania logicznego deterministycznego. Ale nie za darmo! Algorytmy wnioskowania statystycznego muszą bowiem uzywać dodatkowych hipotez opartych na wiedzy dotyczącej konkretnego modelu.

13.8. Filtr spamu wykorzystujący regułę ayesa Filtrowanie poczty elektronicznej w celu odrzucenia niechcianych wiadomości e-mail, tzw. spamu, jest coraz powaŝniejszym problemem ze względu na ogromny wzrost skali zjawiska. Najlepsze programy filtrujące wykorzystują wnioskowanie statystyczne oparte na twierdzeniu ayesa. Do tej grupy naleŝy program filtrujący opracowany przez aula Grahama (2003) (http://www.paulgraham.com). Idea filtracji bayesowskiej polega na analizie statystycznej częstości pojawiania się słów w e-mailach zwykłych i w spamie. ( slowa spam) ( spam) ( spam slowa) = ( slowa) rawdopodobieństwa występowania słów w spamie są aktualizowane na podstawie nadchodzących e-maili.

13.8. Filtr spamu wykorzystujący regułę ayesa rzykłady e-maili: spam Return-ath: <z_q_c_x@263.net> Delivered-To: wg-pg@wg.archub.org Received: (qmail 17529 invoked from network); 11 Aug 2002 17:32:07-0000 Received: from unknown (HELO mail100.store.yahoo.com) (216.136.225.204) by ip67-89-31-66.z31-89-67.customer.algx.net with SMT; 11 Aug 2002 17:32:07-0000 Received: from 263.net ([61.50.141.181]) by mail100.store.yahoo.com (8.11.2/8.11.2) with ESMT id g7hxfg50998 for <psg@paulgraham.com>; Sun, 11 Aug 2002 10:33:41-0700 (DT) Message-Id: <200208111733.g7HXfg50998@mail100.store.yahoo.com> From: "zqcx" <z_q_c_x@263.net> Subject: permission to enter Chinese market To: psg@paulgraham.com Content-Type: text/plain;charset="g2312" Reply-To: z_q_c_x@263.net Date: Mon, 12 Aug 2002 01:32:33 +0800 X-riority: 3 X-Mailer: Microsoft Outlook Express 6.00.2600.0000 Dear Sir or Madam: lease reply to Receiver: China Enterprise Management Co., Ltd. (CMC) E-mail: unido@chinatop.net As one technical organization supported by China Investment and Technical romotion Office of United Nation Industry Development Organization (UNIDO), we cooperate closely with the relevant Chinese Quality Supervision and Standardization Information Organization. We provide the most valuable consulting services to help you to open Chinese market within the shortest time: 1. Consulting Service on Mandatory National Standards of The eople's Republic of China. 2. Consulting Service on Inspection and Quarantine Standards of The eople's Republic of China. 3. Consulting Service for ermission to Enter Chinese Market We are very sorry to disturb you! More information, please check our World Wide Web: http://www.chinatop.net Sincerely yours normalny Return-ath: <dxn@redwoodsoft.com> Delivered-To: wg-pg@wg.archub.org Received: (qmail 21646 invoked from network); 11 Aug 2002 20:31:25-0000 Received: from unknown (HELO mail100.store.yahoo.com) (216.136.225.204) by ip67-89-31-66.z31-89-67.customer.algx.net with SMT; 11 Aug 2002 20:31:25-0000 Received: from pacman.redwoodsoft.com (pacman.redwoodsoft.com [63.150.15.206]) by mail100.store.yahoo.com (8.11.2/8.11.2) with SMT id g7kx1g08171 for <psg@paulgraham.com>; Sun, 11 Aug 2002 13:33:01-0700 (DT) Received: (qmail 11372 invoked from network); 11 Aug 2002 20:33:01-0000 Received: (QMFILT: 1.1); 11 Aug 2002 20:33:01-0000 Received: from localhost (127.0.0.1) by localhost with SMT; 11 Aug 2002 20:33:01-0000 Date: Sun, 11 Aug 2002 13:33:01-0700 (DT) From: Dru Nelson <dxn@redwoodsoft.com> To: psg@paulgraham.com Subject: Continuation style web programming Message-ID: <ine.lnx.4.40.0208111331270.4728-100000@pacman.redwoodsoft.com> MIME-Version: 1.0 Content-Type: TEXT/LAIN; charset=us-ascii Hi, Do you have any examples online of that continuation style web programming that you describe? For example, you mention that you needed the user to go to a color picker screen and then return to the same spot. I'm interested on what was required to achieve that. Did you have to use real continuations to achieve that? Dru Nelson San Carlos, California

13.8. Filtr spamu wykorzystujący regułę ayesa Algorytm filtrowania bayesowskiego E-maile dzieli się na dwie klasy: normalne i spam. Skanuje się cały tekst (całą wiadomość, nagłówki, instrukcje html i javascript), wyłuskuje się słowa (tokeny) i odrzuca się separatory, liczby, komentarze html. Zlicza się wystąpienia słów. Dla kaŝdego słowa oblicza się prawdopodobieństwo tego, Ŝe zawierający je e-mail jest spamem. Wybiera się 15 słów interesujących, tj. takich dla których prawdopodobieństwo jest dalekie od 0.4 (słowo niewinne ). Oblicza się prawdopodobieństwo dla wybranych 15 słów (spam) = k (słowo k ) / ( k (słowo k ) + k ( 1-(słowo k ) ) ) E-mail uznaje się za spam, jeŝeli (spam) > 0.9.

13.8. Filtr spamu wykorzystujący regułę ayesa rzykład Analizujemy dwa e-maile: podejrzany i niewinny Słowo (słowo) madam 0.99 promotion 0.99 republic 0.99 shortest 0.0472 mandatory 0.0472 standardization 0.0734 sorry 0.0822 supported 0.0901 people's 0.0901 enter 0.9075 quality 0.8921 organization 0.1245 investment 0.8568 very 0.1475 valuable 0.8234 Słowo (słowo) continuation 0.01 describe 0.01 continuations 0.01 example 0.0336 programming 0.0521 I'm 0.0554 examples 0.0797 color 0.9189 local host 0.0988 hi 0.1165 California 0.8442 same 0.1598 spot 0.1654 us-ascii 0.1680 what 0.1921 rawdopodobieństwa wynoszą dla obu e-maili odpowiednio, (email-1) = 0.9028 e-mail jest spamem, (email-2) = 1.6 10-14 e-mail nie jest spamem. Skuteczność algorytmu Grahama jest bardzo wysoka: program nie odrzucił Ŝadnej wiadomości dobrej. program zakwalifikował nieprawidłowo tylko 5 spośród 1000 wiadomości typu spam.

odsumowanie Teoria prawdopodobieństwa stanowi ścisły opis niepewności. rawdopodobieństwo kaŝdego zdarzenia elementarnego określa rozkład łączny prawdopodobieństwa. rawdopodobieństwa zdań złoŝonych mogą być wyznaczane poprzez dodawanie prawdopodobieństw zdarzeń elementarnych. Wymiar rozkładu łącznego zaleŝy wykładniczo od liczby zmiennych losowych opisujących zadanie. Redukcję wymiaru rozkładu łącznego moŝna osiągnąć wykorzystując niezaleŝność zupełną oraz niezaleŝność warunkową zdarzeń.

DODATEK Wnioskowanie statystyczne w świecie Wumpusa rzykład szczegółowy

13.7. Wnioskowanie statystyczne w świecie Wumpusa rzykład sytuacji, w której wnioskowanie statystyczne jest lepsze niŝ logiczne wnioskowanie deterministyczne. Sytuacja w świecie Wumpusa (w tym przykładzie zakładamy, Ŝe nie ma Wumpusa i złota) : 1,1 1,2 2,1 1,2 2,1 Doły mogą znajdować się więc w polach (1,3), (2,2) lub (3,1). Wnioskowanie deterministyczne? (logiczne) nie powie jednak agentowi, na które z tych pól moŝe się bezpiecznie przemieścić. Obserwacje agenta są lokalne, więc informacja którą posiada o środowisku jest niepełna. Wnioskowanie statystyczne pozwoli jednak stwierdzić, które pole jest najbezpieczniejsze (chociaŝ bez gwarancji!). otrzebne są jednak dodatkowe informacje lub hipotezy.?? A???

13.7. Wnioskowanie statystyczne w świecie Wumpusa Zmienne losowe: i,j - zmienna logiczna równa 1 gdy w polu (i,j) jest dół; - zmienna logiczna równa 1 gdy w polu (i,j) wieje wiatr. i,j Hipoteza statystyczna: Rozkład dołów jest równomierny. rawdopodobieństwo dołu w polu (i,j) Fakty (obserwacje): ( i,j =1) = 0.2, ( i,j =0) = 1 - ( i,j =1) = 0.8. znane = 1,1 1,2 2,1 b = 1,1 1,2 2,1 ytania: ( 1,3 znane,b) = ( 3,1 znane,b) =?, ( 2,2 znane,b) =? Rozkład łączny prawdopodobieństwa: ( 1,1,, 4,4, 1,1, 1,2, 2,1 ) = = ( 1,1, 1,2, 2,1 1,1,, 4,4 ) ( 1,1,, 4,4 ) Rozkład prawdopodobieństwa a priori rozmieszczenia n dołów ( 1,1,, 4,4 ) = i,j = (1,1),..,(4,4) ( i,j ) = 0.2 n 0.8 16-n

13.7. Wnioskowanie statystyczne w świecie Wumpusa Ze wzoru dla prawdopodobieństwa warunkowego: ( 1,3 znane,b) = α Σ nieznane ( 1,3,nieznane,znane,b) Liczba pól niewiadomych = 12 liczba wyrazów = 2 12 = 4096 Liczba składników we wzorze rośnie więc wykładniczo ze wzrostem liczby pól. Dokładniejsza analiza zadania pod kątem zaleŝności zjawisk pozwala jednak istotnie ograniczyć tę liczbę. Na obserwacje w polach (1,2) i (2,1) wpływają tylko doły w polach (1,3), (2,2) i (3,1) (granica). ola inne (np. (4,4)) nie mają wpływu na pola (1,2) i (2,1). Wiatry w polach 1,2 i 2,1 są niezaleŝne warunkowo od zawartości pól inne przy danych zawartościach pól znane i granica.

13.7. Wnioskowanie statystyczne w świecie Wumpusa rawdopodobieństwo warunkowe dołu w polu (1,3) jest równe ( 1,3 znane,b) = = α Σ nieznane (b 1,3, znane,nieznane) ( 1,3, znane,nieznane) = (z reguły iloczynu) = α Σ granica Σ inne (b znane, 1,3,granica,inne) ( 1,3, znane,granica,inne) = (z niezaleŝności warunkowej) = α Σ granica Σ inne (b znane, 1,3,granica) ( 1,3, znane,granica,inne) = (pierwsze wyrazy nie zaleŝą od pól inne) = α Σ granica (b znane, 1,3,granica) Σ inne ( 1,3, znane,granica,inne)

13.7. Wnioskowanie statystyczne w świecie Wumpusa Z niezaleŝności wynika moŝliwość faktoryzacji drugich wyrazów ( 1,3 znane,b) = α Σ granica (b znane, 1,3,granica) Σ inne ( 1,3 ) (znane) (granica) (inne) o przegrupowaniu wyrazów otrzymujemy ( 1,3 znane,b) = α (znane) ( 1,3 ) Σ granica (b znane, 1,3,granica) (granica) Σ inne (inne) oniewaŝ Σ inne (inne) = 1 oraz przyjmując α = α (znane) otrzymujemy ( 1,3 znane,b) = = α ( 1,3 ) Σ granica (b znane, 1,3,granica) (granica) w którym sumowanie obejmuje dwa pola granicy: (2,2) i (3,1).

13.7. Wnioskowanie statystyczne w świecie Wumpusa Wartość (b znane, 1,3,granica) jest równa (b znane, 1,3,granica) = 1 gdy granica jest zgodna z obserwacją b, (b znane, 1,3,granica) = 0 w przypadku przeciwnym Dla kaŝdej wartości 1,3 wykonujemy sumowanie względem modeli połoŝenia dołów dla pól granicy rawdopodobieństwa dołów w polach (2,2) i (3,1): 0.2 0.2 = 0.04 0.2 0.8 = 0.16 0.8 0.2 = 0.16 0.2 0.2 = 0.04 0.2 0.8 = 0.16 rawdopodobieństwo dołu w polu (1,3) jest więc równe ( 1,3 znane,b) = α 0.2 (0.04+0.16+0.16), 0.8 (0.04+0.16) = = α 0.072, 0.16 = 0.072, 0.16 / ( 0.072+0.16 ) = = 0.31, 0.69

13.7. Wnioskowanie statystyczne w świecie Wumpusa rawdopodobieństwo dołu w polu (2,2), ( 2,2 znane,b) wyznaczymy analogicznie. Dla kaŝdej wartości 2,2 wykonujemy sumowanie względem modeli połoŝenia dołów dla pól granicy rawdopodobieństwa dołów w polach (1,3) i (3,1): 0.2 0.2 = 0.04 0.2 0.8 = 0.16 0.2 0.2 = 0.04 0.8 0.2 = 0.16 0.8 0.8 = 0.64 rawdopodobieństwo dołu w polu (2,2) jest więc równe ( 2,2 znane,b) = α 0.2 (0.04+0.16+0.16+0.64), 0.8 (0.04) = = α 0.2, 0.032 = 0.2, 0.032 / (0.2+0.032) = = 0.86, 0.13

13.7. Wnioskowanie statystyczne w świecie Wumpusa orównujemy prawdopodobieństwa: ( 1,3 znane,b) = ( 0.31, 0.69 ) = ( 3,1 znane,b) ( 2,2 znane,b) = ( 0.86, 0.13 ) rawdopodobieństwo dołu w polu (2,2) jest więc znacznie większe niŝ w polach (1,3) lub (3,1). 0.31 0.86 Agent powinien więc unikać pola (2,2)! A 0.31 Wnioskowanie statystyczne pozwoliło zatem (przy dodatkowym załoŝeniu dotyczącym rozkładu dołów) uzyskać bardziej przydatne wyniki niŝ otrzymane z wnioskowania deterministycznego. Algorytmy wnioskowania statystycznego muszą jednak wykorzystywać dodatkowe hipotezy niezaleŝności zdarzeń oparte na wiedzy dotyczącej konkretnego modelu.