Twierdzenie Bayesa. Indukowane Reguły Decyzyjne Jakub Kuliński Nr albumu: 53623



Podobne dokumenty
Komputer i urządzenia z nim współpracujące

Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego

Automatyczne przetwarzanie recenzji konsumenckich dla oceny użyteczności produktów i usług

XIII KONKURS MATEMATYCZNY

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

Konspekt lekcji otwartej

PRZEDMIOTOWY SYSTEM OCENIANIA z przedmiotu matematyka

analiza drzewa zdarzeń

Zadania. SiOD Cwiczenie 1 ;

Praca za granicą. Emerytura polska czy zagraniczna?

WYKŁAD 8. Postacie obrazów na różnych etapach procesu przetwarzania

ZAŁĄCZNIK NR 1. Zakres wiedzy i umiejętności oraz wykaz proponowanej bibliografii

Wykonawcy biorący udział w postępowaniu przetargowym na ubezpieczenie mienia i odpowiedzialności Zamawiającego.

Harmonogramowanie projektów Zarządzanie czasem

TEORIA GIER W EKONOMII WYKŁAD 1: GRY W POSTACI EKSTENSYWNEJ I NORMALNEJ

Przedstawiamy raport z badań, jakie były przeprowadzane podczas spotkań w szkołach, w związku z realizacją projektu Szkoła na TAK.

Szczegółowe wyjaśnienia dotyczące definicji MŚP i związanych z nią dylematów

Zestawienie wartości dostępnej mocy przyłączeniowej źródeł w sieci RWE Stoen Operator o napięciu znamionowym powyżej 1 kv

PROCEDURA OCENY RYZYKA ZAWODOWEGO. w Urzędzie Gminy Mściwojów

1. Proszę krótko scharakteryzować firmę którą założyła Pani/Pana podgrupa, w zakresie: a) nazwa, status prawny, siedziba, zasady zarządzania (5 pkt.

Zadanie 1. Liczba szkód w każdym z trzech kolejnych lat dla pewnego ubezpieczonego ma rozkład równomierny:

SCENARIUSZ LEKCJI Opracował: mgr inż. Szymon Surmacewicz ZESPÓŁ SZKÓŁ MECHANICZNYCH CKP NR 2 W BIAŁYMSTOKU

PROGRAM STYPENDIALNY GMINY DOBRZYCA

Logika I. Wykład 2. Działania na zbiorach

Międzyszkolny Konkurs Matematyczny. dla klasy trzeciej

UCHWAŁA NR 660/2005 RADY MIEJSKIEJ W RADOMIU. z dnia roku

Kielce, dnia 12 stycznia 2016 r. Poz. 207 UCHWAŁA NR XVII/155/2015 RADY MIEJSKIEJ W KOŃSKICH. z dnia 30 grudnia 2015 r.

Zarządzanie kosztami w dziale utrzymania ruchu

- 70% wg starych zasad i 30% wg nowych zasad dla osób, które. - 55% wg starych zasad i 45% wg nowych zasad dla osób, które

Zarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska

ZASADY WYPEŁNIANIA ANKIETY 2. ZATRUDNIENIE NA CZĘŚĆ ETATU LUB PRZEZ CZĘŚĆ OKRESU OCENY

Człowiek najlepsza inwestycja

Procedura nadawania uprawnień do potwierdzania Profili Zaufanych w Urzędzie Gminy w Ryjewie

UCHWAŁA nr XLVI/262/14 RADY MIEJSKIEJ GMINY LUBOMIERZ z dnia 25 czerwca 2014 roku

III. GOSPODARSTWA DOMOWE, RODZINY I GOSPODARSTWA ZBIOROWE

MATEMATYKA 4 INSTYTUT MEDICUS FUNKCJA KWADRATOWA. Kurs przygotowawczy na studia medyczne. Rok szkolny 2010/2011. tel

Ustawienie wózka w pojeździe komunikacji miejskiej - badania. Prawidłowe ustawienie

FORMULARZ ZGŁOSZENIOWY DO COACHINGU W RAMACH PROJEKTU TRASA 78 ZE ŚLĄSKIEGO W ŚWIĘTOKRZYSKIE

Raport z realizacji projektu szkoleń w ramach programu Komputer dla ucznia w roku Uczestnicy projektu oraz ewaluacja szkoleń

MUZEUM NARODOWYM W POZNANIU,

Elementy cyfrowe i układy logiczne

WIEDZA O SPOŁECZEŃSTWIE

Wyjaśnienie nr 1 i Zmiana nr 2 treści specyfikacji istotnych warunków zamówienia

Rozdział 1 Postanowienia ogólne

Warszawa, dnia 6 listopada 2015 r. Poz ROZPORZĄDZENIE MINISTRA ROLNICTWA I ROZWOJU WSI 1) z dnia 23 października 2015 r.

Dokumentacja nauczyciela mianowanego ubiegającego się o stopień nauczyciela dyplomowanego

DECYZJA w sprawie czasowego zaprzestania działalności

ZAPYTANIE OFERTOWE z dnia r

Tytuł. Autor. Dział. Innowacyjne cele edukacyjne. Czas. Przebieg. Etap 1 - Wprowadzenie z rysem historycznym i dyskusją

Podatek przemysłowy (lokalny podatek od działalności usługowowytwórczej) :02:07

Ranking zawodów deficytowych i nadwyżkowych w powiecie strzelińskim w roku 2009

TAJEMNICA BANKOWA I OCHRONA DANYCH OSOBOWYCH W PRAKTYCE BANKOWEJ

MUP.PK.III.SG /08 Lublin, dnia r.

PRZEDMIOTOWY SYSTEM OCENIANIA Z MATEMATYKI I LICEUM OGÓLNOKSZTAŁCĄCE IM. MIKOŁAJA KOPERNIKA W KROŚNIE

woli rodziców w 2010 roku. 1. W roku szkolnym 2016/2017 obowiązek szkolny spełniają dzieci urodzone w 2009 roku oraz z

PILNE Informacje dotyczące bezpieczeństwa Aparat ultrasonograficzny AFFINITI 70 firmy Philips

Sieci komputerowe cel

Polska-Katowice: Usługi wiertnicze 2016/S

KOMISJA WSPÓLNOT EUROPEJSKICH, uwzględniając Traktat ustanawiający Wspólnotę Europejską, ROZDZIAŁ 1

Sztuczna inteligencja : Naiwny klasyfikator Bayesa

WYMAGANIA EDUKACYJNE Z PRZEDMIOTÓW ZAWODOWYCH ODBYWAJĄCYCH SIĘ W SZKOLNYM LABORATORIUM CHEMICZNYM

KRYTERIA DOSTĘPU. Działanie 2.1,,E-usługi dla Mazowsza (typ projektu: e-administracja, e-zdrowie)

Rozdział 6. KONTROLE I SANKCJE

SCENARIUSZ LEKCJI WYCHOWAWCZEJ: AGRESJA I STRES. JAK SOBIE RADZIĆ ZE STRESEM?

Biznesplan - Projekt "Gdyński Kupiec" SEKCJA A - DANE WNIOSKODAWCY- ŻYCIORYS ZAWODOWY WNIOSKODAWCY SEKCJA B - OPIS PLANOWANEGO PRZEDSIĘWZIĘCIA

Przedmiotowy System Oceniania Język polski

Opis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej

UCHWAŁA Nr RADY MIASTA KONINA. w sprawie ustalenia stawek opłat za zajęcie pasa drogowego.

Wymiana nawierzchni chodników oraz dróg dojazdowych wokół budynku, rozbiórka i ponowny montaż prefabrykowanego muru oporowego

Praca badawcza. Zasady metodologiczne ankietowego badania mobilności komunikacyjnej ludności

Przeprowadzenie kompleksowej optymalizacji funkcjonowania jednostki, wprowadzenie nowego systemu zarządzania i wynagradzania

PRZEDMIOTOWY SYSTEM OCENIANIA Z PODSTAW PSYCHOLOGII W KLASIE DRUGIEJ. Ocenianie wewnątrzszkolne na przedmiocie podstawy psychologii ma na celu:

UCHWAŁA NR XVIII/140/16 RADY POWIATU W KOSZALINIE. z dnia 21 kwietnia 2016 r.

Regulamin przyznawania stypendiów doktorskich pracownikom Centrum Medycznego Kształcenia Podyplomowego

Temat: Funkcje. Własności ogólne. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1

Edu-Sense Sp. z o.o. Lubelski Park Naukowo-Technologiczny ul. Dobrzańskiego Lublin Strona 1

Efektywna strategia sprzedaży

Karta informacyjna przedsięwzięcia Przebudowa budynku warsztatu

1. Od kiedy i gdzie należy złożyć wniosek?

Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, Warszawa

InsERT GT Własne COM 1.0

Ogólna charakterystyka kontraktów terminowych

OFERTA Nazwa Wykonawcy (wykonawców występujących wspólnie):... ADRES:... TEL.:... REGON:... NIP:... Adres do

Marcin Hyła Sejm RP

Procedura nadawania uprawnień do potwierdzania, przedłuŝania waŝności i uniewaŝniania profili zaufanych epuap. Załącznik nr 1

Podstawowe działania w rachunku macierzowym

DZIENNIK USTAW RZECZYPOSPOLITEJ POLSKIEJ

Uchwała Nr XXII / 242 / 04 Rady Miejskiej Turku z dnia 21 grudnia 2004 roku

Urządzenia do bezprzerwowego zasilania UPS CES GX RACK. 10 kva. Wersja U/CES_GXR_10.0/J/v01. Praca równoległa

REGULAMIN przeprowadzania okresowych ocen pracowniczych w Urzędzie Miasta Mława ROZDZIAŁ I

2. Nie mogą brać udziału w działaniach ratowniczych strażacy, których stan wskazuje, że są pod wpływem alkoholu lub innych środków odurzających.

Studia podyplomowe Legislacja administracyjna

7. OPRACOWYWANIE DANYCH I PROWADZENIE OBLICZEŃ powtórka

Szanowni Państwo. Badania laboratoryjne obejmować będą :

Biegi dla dzieci i młodzieży w ramach 2 Zambrowskiego Biegu Ulicznego

EGZAMIN MATURALNY Z INFORMATYKI 19 MAJA 2015

Wniosek o dofinansowanie zakupu podręczników w roku szkolnym 2014/2015

WOJEWÓDZKI KONKURS FIZYCZNY

Wniosek o przyznanie stypendium szkolnego

Transkrypt:

Twierdzenie Bayesa Indukowane Reguły Decyzyjne Jakub Kuliński Nr albumu: 53623

Niniejszy skrypt ma na celu usystematyzowanie i uporządkowanie podstawowej wiedzy na temat twierdzenia Bayesa i jego zastosowaniu w regułach decyzyjnych. Twierdzenie Bayesa jest bezpośrednio związane z prawdopodobieństwem warunkowym i ma ono na celu jego korygowanie w oparciu o późniejsze uzyskanie dodatkowych informacji o zachodzących zdarzeniach. DEFINICJA 1 PRAWDOPODOBIEŃSTWO WARUNKOWE Prawdopodobieństwem warunkowym zajścia zdarzenia zdarzenia, gdzie, nazywamy liczbę: pod warunkiem zajścia Kluczowe z zrozumieniu Twierdzenia Bayesa jest dostrzeżenie, że mamy tu do czynienia ze zdarzeniami zachodzącymi po sobie i każde z nich niesie za sobą nową, dodatkową informację o tych zdarzeniach oraz, że te nowe informacje służą korygowaniu prawdopodobieństwa zdarzenia początkowego. W tym kontekście używa się pojęć prawdopodobieństwa a priori oraz prawdopodobieństwa a posteriori. DEFINICJA 2 PRAWDOPODOBIEŃSTWO A PRIORI Prawdopodobieństwem a priori nazywamy prawdopodobieństwo obliczane przed realizacją doświadczenia losowego. DEFINICJA 3 PRAWDOPODOBIEŃSTWO A POSTERIORI Prawdopodobieństwem a posteriori nazywamy prawdopodobieństwo obliczane po realizacji doświadczenia losowego. PRZYKŁAD 1 Instytut Gallup a do swoich badań na temat korzystania z kart płatniczych losowo dobiera pewną część populacji obywateli USA. Na podstawie własnej wiedzy proszę oszacować prawdopodobieństwa poniższych zdarzeń: 1) Jakie jest prawdopodobieństwo, że losowo wybrany respondent jest mężczyzną? 2) Po wylosowaniu respondenta ustalono, że palił(-a) on(-a) papierosy. Jakie jest teraz prawdopodobieństwo, że losowo wybrany respondent był mężczyzną? [2]

3) Które z powyższych prawdopodobieństw jest prawdopodobieństwem a priori/ a posteriori? ROZWIĄZANIE 1) Niemal połowę obywateli USA stanowią mężczyźni, zatem można oszacować, że prawdopodobieństwo wylosowania mężczyzny wynosi. Oznaczając zdarzenie Wylosowano mężczyznę jako, prawdopodobieństwo zdarzenia wynosi: ; 2) Pomimo tego, że część kobiet pali papierosy to znacznie większy odsetek palących jest wśród płci męskiej. Przypuszcza się, że 75% palaczy to mężczyźni. Bazując na dodatkowej informacji ( wybrany respondent jest palaczem zdarzenie ), szacujemy, że prawdopodobieństwo wylosowania palącego mężczyzny wynosi ; 3) Prawdopodobieństwo z 1) a priori (przed doświadczeniem) Prawdopodobieństwo z 2) a posteriori (po doświadczeniu) Po wyjaśnieniu kluczowych pojęć, można przejść do Twierdzenia Bayesa, które wyjaśnia nie tyle sam wynik doświadczenia losowego, co jego przebieg: TWIERDZENIE 1 WZÓR BAYESA Niech będzie ciągiem zdarzeń takim, że dla oraz oraz. Wtedy: gdzie: DOWÓD: Z definicji na prawdopodobieństwo warunkowe oraz całkowite otrzymujemy: [3]

PRZYKŁAD 2 Test na rzadką chorobę, która dotyka średnio 1 osobę na tysiąc, daje tzw. fałszywą pozytywną odpowiedź u 4% zdrowych, przy czym u chorych wynik pozytywny występuje zawsze. Jaka jest szansa, że osoba, u której test dał odpowiedź pozytywną, jest rzeczywiście chora? Założono, że u chorej osoby nie występują jakiekolwiek objawy choroby. ROZWIĄZANIE Niech: Zdarzenie oznacza pozytywną odpowiedź testu, Zdarzenie osobę chorą, Zdarzenie osobę zdrową. Ze wzoru Bayesa można obliczyć: ODPOWIEDŹ: Choć rachunki we wzorze Bayesa są dość proste, to ich wynik może wydawać się zaskakujący i sprzeczny z intuicją Szansa, że osoba, u której test wykazał odpowiedź pozytywną jest rzeczywiście chora, wynosi 2,44%. PRZYKŁAD 3 Automatyczny nadajnik ratunkowy ELT jest urządzeniem, które w razie wypadku lub awarii samolotu emituje sygnał ostrzegawczy. 75% tych urządzeń jest produkowanych przez Awaxes Corp., 20% przez Airsafe, a pozostałe przez chińskiego producenta Ciongshunshi. Nadajniki produkowane przez Awaxes Corp. charakteryzują się wysokim stopniem niezawodności 4 nadajniki na 100 posiadały wady fabryczne. Wśród urządzeń firmy Airsafe współczynnik ten jest nieznacznie wyższy 6%. Najgorzej radzi sobie firma Ciongshunshi, w której to aż 10 nadajników na 100 posiadało wady (co prawdopodobnie tłumaczy ich pozycję na rynku). Jakie jest prawdopodobieństwo, że uszkodzony nadajnik był wyprodukowany przez firmą Awaxes Corp.? [4]

ROZWIĄZANIE Wprowadzono następujące oznaczenia: Zdarzenie nadajnik jest niesprawny Zdarzenie nadajnik jest sprawny Zdarzenie nadajnik wyprodukowany przez Awaxes Corp., Zdarzenie nadajnik wyprodukowany przez Airsafe Zdarzenie nadajnik wyprodukowany przez Ciongshunshi. Szukane prawdopodobieństwo to. Z danych zadania wynika, że: Dane podstawiamy do wzoru z Twierdzenia 1: ODPOWIEDŹ: Prawdopodobieństwo, że uszkodzony nadajnik pochodził z firmy Awaxes Corp. wynosi 63,8% [5]

ZASTOSOWANIE TWIERDZENIA BAYESA W REGUŁACH DECYZYJNYCH NAIWNY KLASYFIKATOR BAYESA Naiwny klasyfikator Bayesa jest bardzo dobrym klasyfikatorem dla problemów charakteryzujących się mnogością wymiarów. Opiera się on na założeniu o wzajemnej niezależności zmiennych niezależnych. Zasadę działania klasyfikatora prezentuje przykład 4. PRZYKŁAD 4 W tabeli 1 przedstawiono zbiór treningowy z bazy danych zawierającej wyniki badania dotyczącego analizy profilu klientów pewnego sklepu z komputerami: Tabela 1 Zbiór treningowy Lp. Wiek Dochód Studia Ocena_kred Zakup_komp 1 <30 wysoki nie dobra nie 2 <30 wysoki nie znakomita nie 3 [30;40] wysoki nie dobra tak 4 >40 średni nie dobra tak 5 >40 niski tak dobra tak 6 >40 niski tak znakomita nie 7 [30;40] niski tak znakomita tak 8 <30 średni nie dobra nie 9 <30 niski tak dobra tak 10 >40 średni tak dobra tak 11 <30 średni tak znakomita tak 12 [30;40] średni nie znakomita tak 13 [30;40] wysoki tak dobra tak 14 >40 średni nie znakomita nie Za pomocą Naiwnego Klasyfikatora Bayesa proszę sprawdzić, czy obiekt X (tzn. osoba poniżej wieku 30 lat, ze średnim dochodem, z ukończonymi studiami i dobrą oceną kredytową) zdecyduje się na zakup komputera. ROZWIĄZANIE 1. Należy obliczyć, dla jakiej wartości i iloczyn osiąga maksimum, gdzie: oznacza prawdopodobieństwo a priori przynależności obiektu do klasy (tutaj: decyzja o zakupie komputera) dla gdzie 1- tak, 2- nie [6]

Ze zbioru treningowego obliczamy: 2. Następnie należy obliczyć prawdopodobieństwa warunkowe dla wszystkich wartości atrybutów: Ze zbioru treningowego obliczamy: 3. Otrzymane wartości podstawiamy do wzorów na oraz. ODPOWIEDŹ: Obiekt X (tzn. osoba poniżej 30 rż., ze średnim dochodem, dobrą oceną kredytową i ukończonymi studiami) przynależy do klasy tzn. najprawdopodobniej zdecyduje się na zakup komputera. [7]

Literatura: R. Sztencel, J. Jakubowski, Rachunek prawdopodobieństwa dla prawie każdego, Wydawnictwo Script, Warszawa 2006 Materiały dydaktyczne z zajęć Rachunek prawdopodobieństwa dr hab., prof. SGH Agata Boratyńska Materiały dydaktyczne z zajęć Informatyka - Politechnika Poznańska Materiały dydaktyczne Uniwersytetu w Waszyngotnie [8]