Odkrywanie wiedzy z danych przy użyciu zbiorów przybliżonych. Wykład 3

Podobne dokumenty
Odkrywanie wiedzy z danych przy użyciu zbiorów przybliżonych. Wykład 2

Sztuczna inteligencja

System informacyjny a system decyzyjny Relacja nierozróżnialności Klasy abstrakcji Teoria zbiorów przybliżonych Usuwanie niespójności z tablicy

WSPOMAGANIE DECYZJI - MIŁOSZ KADZIŃSKI LAB IV ZBIORY PRZYBLIŻONE I ODKRYWANIE REGUŁ DECYZYJNYCH

Systemy ekspertowe. Eksploracja danych z wykorzystaniem tablic decyzyjnych i zbiorów przybliżonych. Część trzecia

Teoretyczne podstawy zbiorów przybliżonych

B jest globalnym pokryciem zbioru {d} wtedy i tylko wtedy, gdy {d} zależy od B i nie istnieje B T takie, że {d} zależy od B ;

Zbiory przybliżone, cz. 1 (wersja do druku) dr. Piotr Szczuko

Sztuczna Inteligencja Projekt

Systemy ekspertowe : Tablice decyzyjne

Zbiory przybliżone w obszarze systemów ekspertowych

Sztuczna Inteligencja Projekt

Wprowadzenie do zbiorów przybliżonych

Jacek Skorupski pok. 251 tel konsultacje: poniedziałek , sobota zjazdowa

Tablicowa reprezentacja danych

Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach PROGRAM KSZTAŁCENIA. Studia III stopnia (doktoranckie) kierunek Informatyka

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści

Systemy uczące się wykład 1

System informacyjny a system decyzyjny Relacja nierozróżnialności Klasy abstrakcji Teoria zbiorów przybliżonych Usuwanie niespójności z tablicy

Systemy ekspertowe. Generowanie reguł minimalnych. Część czwarta. Autor Roman Simiński.

LISTA KURSÓW PLANOWANYCH DO URUCHOMIENIA W SEMESTRZE ZIMOWYM 2015/2016

3-letnie (6-semestralne) stacjonarne studia licencjackie kier. matematyka stosowana profil: ogólnoakademicki. Semestr 1. Przedmioty wspólne

SZTUCZNA INTELIGENCJA

ECTS Razem 30 Godz. 330

1 Programowanie urządzen mobilnych Sztuczna inteligencja i systemy 2 ekspertowe

Informatyka- studia I-go stopnia

Objaśnienia oznaczeń w symbolach K przed podkreślnikiem kierunkowe efekty kształcenia W kategoria wiedzy

INFORMATYKA. PLAN STUDIÓW NIESTACJONARNYCH 2-go STOPNIA (W UKŁADZIE ROCZNYM) STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM A K L S P

PRZEWODNIK PO PRZEDMIOCIE

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

Systemy uczące się wykład 2

INFORMATYKA PLAN STUDIÓW NIESTACJONARNYCH 2-GO STOPNIA (W UKŁADZIE ROCZNYM) STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM 2015/16

Podstawy Sztucznej Inteligencji (PSZT)

Wnioskowanie Boolowskie i teoria zbiorów przybli»onych

Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych

Kształcenie w Szkole Doktorskiej Politechniki Białostockiej realizowane będzie według następującego programu:

Zbiory przybliżone nowa matematyczna metoda analizy danych

Kierunek: INFORMATYKA. Studia stacjonarne. Studia drugiego stopnia. Profil: ogólnoakademicki

Zbiory przybliżone wnioskowanie przybliżone

SPIS TREŚCI WSTĘP... 10

ALGORYTMY INDUKCJI REGUŁ DECYZYJNYCH W ODKRYWANIU WIEDZY

PRZEWODNIK PO PRZEDMIOCIE

Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2

Opis. Wymagania wstępne (tzw. sekwencyjny system zajęć i egzaminów) Liczba godzin zajęć dydaktycznych z podziałem na formy prowadzenia zajęć

MATEMATYCZNE METODY WSPOMAGANIA PROCESÓW DECYZYJNYCH

PRACA DYPLOMOWA MAGISTERSKA. Analiza danych z zastosowaniem teorii zbiorów przybliżonych.

Kurs logiki rozmytej. Wojciech Szybisty

Aproksymacja diofantyczna

Sylabus modułu kształcenia na studiach wyższych. Nazwa Wydziału. Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

ZASTOSOWANIE ZBIORÓW PRZYBLIŻONYCH DO ANALIZY SATYSFAKCJI KLIENTA SERWISU POJAZDÓW

V Seminarium Naukowe "Inżynierskie zastosowania technologii informatycznych" - relacja

Zatwierdzono na Radzie Wydziału w dniu 11 czerwca 2015 r.

INFORMATYKA. PLAN STUDIÓW STACJONARNYCH 2-go STOPNIA (W UKŁADZIE SEMESTRALNYM) STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM A K L S P

Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak

Reprezentacja rozmyta - zastosowania logiki rozmytej

WA R S AW D ATA S C I E N C E M E E T U P

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

HARMONOGRAM GODZINOWY ORAZ PUNKTACJA ECTS CZTEROLETNIEGO STUDIUM DOKTORANCKIEGO

PRZEWODNIK PO PRZEDMIOCIE

Obowiązują od naboru na rok ak. 2014/2015. Egzamin po semestrze. seminarium. laboratoria. Razem

II. MODUŁY KSZTAŁCENIA

1.1 Matryca pokrycia efektów kształcenia. Efekty kształcenia w zakresie wiedzy. Efekty kształcenia w zakresie umiejętności

Algorytmy wspomagania decyzji Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s.

Metoda tabel semantycznych. Dedukcja drogi Watsonie, dedukcja... Definicja logicznej konsekwencji. Logika obliczeniowa.

METODY WNIOSKOWANIA W OPARCIU O NIEKOMPLETNY

Wprowadzenie do zbiorów przybli»onych

Matryca pokrycia efektów kształcenia. Efekty kształcenia w zakresie wiedzy (cz. I)

PROGRAM STUDIÓW. Egzamin, kolokwium, projekt, aktywność na zajęciach.

Algorytmy wspomagania decyzji Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s. 230/C-3

INFORMATYKA. PLAN STUDIÓW STACJONARNYCH INŻYNIERSKICH 2-go STOPNIA STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM 2018/19.

Granular Computing 9999 pages 15 METODY SZTUCZNEJ INTELIGENCJI - PROJEKTY

Kryteria oceny pracy doktoranta przez opiekuna naukowego

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Analiza danych i data mining.

INSTYTUT NAUK EKONOMICZNYCH I INFORMATYKI Rozkład zajęć, Semestr zimowy, Kierunek INFORMATYKA PONIEDZIAŁEK

Wprowadzenie do teorii systemów ekspertowych

KARTA PRZEDMIOTU. 2. Kod przedmiotu: SYSTEMY INFORMACYJNE W MEDYCYNIE

PRZEWODNIK PO PRZEDMIOCIE

Wnioskowanie rozmyte. Krzysztof Patan

ALGORYTM RANDOM FOREST

Metoda Tablic Semantycznych

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

1. Reguły minimalne (optymalne) Podstawowe twierdzenia i definicje. Definicja 1 Funkcję postaci f. nazwiemy n-argumentową funkcją boolowską.

Metody Sztucznej Inteligencji Methods of Artificial Intelligence. Elektrotechnika II stopień ogólno akademicki. niestacjonarne. przedmiot kierunkowy

Elementy metod numerycznych

Zastosowania metod odkrywania wiedzy do diagnostyki maszyn i procesów

ZDZISŁAW PIĄTKOWSKI, ANNA KUŁAKOWSKA WSTĘP... 7 BEATA MIELIŃSKA-LASOTA ROZDZIAŁ I ISTOTA I PRZEDMIOT ORGANIZACJI I ZARZĄDZANIA...9

Przedmiot nauk o zarządzaniu Organizacja w otoczeniu rynkowym jako obiekt zarządzania Struktury organizacyjne Zarządzanie procesowe

Repetytorium z matematyki 3,0 1,0 3,0 3,0. Analiza matematyczna 1 4,0 2,0 4,0 2,0. Analiza matematyczna 2 6,0 2,0 6,0 2,0

Podstawy Programowania Obiektowego

Interwałowe zbiory rozmyte

Prof. Stanisław Jankowski

WSKAŹNIKI ILOŚCIOWE - Punkty ECTS w ramach zajęć: Efekty kształcenia. Wiedza Umiejętności Kompetencje społeczne (symbole) MK_1. Analiza matematyczna

Wykład 2. Relacyjny model danych

Systemy ekspertowe : program PCShell

JAKOŚĆ DANYCH Z PERSPEKTYWY SYSTEMÓW WSPOMAGANIA DECYZJI KLINICZNYCH. Dr hab. inż. Szymon Wilk Politechnika Poznańska Instytut Informatyki

Metody zbiorów przybliżonych w uczeniu się podobieństwa z wielowymiarowych zbiorów danych

Transkrypt:

Odkrywanie wiedzy z danych przy użyciu zbiorów przybliżonych Wykład 3

W internecie Teoria zbiorów przybliżonych zaproponowany w 1982 r. przez prof. Zdzisława Pawlaka formalizm matematyczny, stanowiący rozwinięcie klasycznej teorii zbiorów. Zbiór przybliżony (ang. rough set) to obiekt matematyczny zbudowany w oparciu o logikę trójwartościową. W swym pierwotnym ujęciu zbiór przybliżony to para klasycznych zbiorów: przybliżenie dolne i przybliżenie górne. Istnieje również odmiana zbioru przybliżonego, definiowana przez parę przybliżeo będących zbiorami rozmytymi (ang. fuzzy set). Dany element może należed do obydwu przybliżeo, do żadnego lub tylko do przybliżenia górnego. Ten ostatni przypadek jest o tyle ciekawy, że pozwala na modelowanie niepewności.

Wstęp Teoria zbiorów przybliżonych opracowana przez Zdzisława Pawlaka, dostarcza narzędzi matematycznych do formalnego opisu wiedzy, w tym wiedzy niepełnej i niedokładnej. Wykorzystywana jest skutecznie m.in. w eksploracji danych i odkrywaniu wiedzy, złożonych zadaniach klasyfikacji oraz w komputerowych systemach wspomagania decyzji. Dziedziny, w których teoria ta została zastosowana to nie tylko medycyna czy biznes (bankowośd, badania rynku) ale również rozpoznawanie mowy, sieci neuronowe czy ogólnie mówiąc sztuczna inteligencja.

O metodzie słów kilka Metodologia zbiorów przybliżonych zyskała sobie dużą popularnośd. Świadectwem tego może byd chociażby fakt, że jest ona przedmiotem badao wielu naukowców na całym świecie, co udokumentowane zostało ok dwoma tysiącami publikacji. Tematyka ta cieszy się ogromnym zainteresowaniem badaczy, którzy czynnie uczestniczą w prowadzonych w tej dziedzinie cyklicznie międzynarodowych konferencjach i seminariach. Wśród krajów szczególnie zaangażowanych wyróżnid można prócz Polski, m.in. USA, Kanadę, Japonię, Francję czy Norwegię. W Polsce tematyka ta znalazła się w centrum badao naukowych prowadzonych w wielu ośrodkach, również na Uniwersytecie Śląskim w Zakładzie Systemów Informatycznych, szczególnie w zakresie zastosowao medycznych.

System informacyjny

System informacyjny a system decyzyjny

Cel: wygenerowanie reguł

Tablica decyzyjna

Relacja nierozróżnialności

IND(C) = {{1},{2,5},{3},{4},{6}} Ale IND({gm})={{1,4,6},{2,5},{3}}

Klasy abstrakcji

Klasy abstrakcji - przykład

Aproksymacja zbiorów

Zbiory przybliżone a problem z jednoznacznością klasyfikacj obiektów

Pojęcia nieostre a zbiór dokładny oraz zbiór przybliżony

Dolne przybliżenie BX = {Y IND(B): Y X} Czyli będą to takie obiekty należące do IND(B), które w całości zawierają się zbiorze X. O obiektach należących do dolnego przybliżenia mówimy, że NA PEWNO należą do danego pojęcia (danej klasy decyzyjnej).

BX = {Y IND(B): Y X} IND(B) = {{1},{2,5},{3},{4},{6}} X = X tak + X nie Które z Y-ków należących do IND(B) w całości zawierają się w X? X tak = {1,2,3,4} X nie = {5,6} BX Tak = {1,3,4} BX Nie = {6} Obiekty {1,3,4} na pewno mają grypę! Obiekt {6} na pewno nie ma grypy!

Górne przybliżenie BX = {Y IND(B): Y X } Czyli będą to takie obiekty należące do IND(B), które wystarczy, że mają częśd wspólną ze zbiorem X. O obiektach należących do górnego przybliżenia mówimy, że BYD MOŻE należą do danego pojęcia (danej klasy decyzyjnej).

BX = {Y IND(B): Y X } IND(B) = {{1},{2,5},{3},{4},{6}} X = X tak + X nie Które z Y-ków należących do IND(B) mają częśd wspólną z X? X tak = {1,2,3,4} X nie = {5,6} BX Tak = {1,2,3,4,5} BX Nie = {2,5,6} Obiekty {1,2,3,4,5} byd może mają grypę! Obiekty {2,5,6} byd może nie ma grypy!

Zbiór dokładny a zbiór przybliżony

Interpretacja

Tablice decyzyjne deterministyczne i niedeterministyczne Każdy obiekt tablicy decyzyjnej TD może zostać zapisany w postaci zdania warunkowego (postaci: jeżeli warunki to decyzja) i byd traktowany jako reguła decyzyjna.

1. jeżeli (g=nie) i (m=tak) i (t=wysoka) to (c=tak) 2. jeżeli (g=tak) i (m=nie) i (t=wysoka) to (c=tak) 3. jeżeli (g=tak) i (m=tak) i (t=bardzo wysoka) to (c=tak) 4. jeżeli (g=nie) i (m=tak) i (t=bardzo wysoka) to (c=tak) 5. jeżeli (g=tak) i (m=nie) i (t=wysoka) to (c=nie) 6. jeżeli (g=nie) i (m=tak) i (t=normalna) to (c=nie)

reguły deterministyczne Reguła w tablicy decyzyjnej TD jest deterministyczna, gdy równość atrybutów warunkowych implikuje równośd atrybutów decyzyjnych. Fakt ten możemy wyrazid przy pomocy następującej zależności dla obiektów tablicy decyzyjnej:

reguły niedeterministyczne Reguła w tablicy decyzyjnej TD jest niedeterministyczna, gdy równość atrybutów warunkowych nie implikuje równości atrybutów decyzyjnych, co można wyrazid następującą zależnością dla obiektów tablicy decyzyjnej:

Niespójnośd

Metody usuwania niespójności

1 metoda

Metoda jakościowa

IND(B) = {{1}{2,5}{3}{4}{6}} X tak = {1,2,3,4} X nie = {5,6} BX Tak = {1,3,4} BX Nie = {6} Tak =3/6 Nie =1/6 Metoda mówi, aby usunąd ten obiekt, dla którego uzyskano mniejszą dokładnośd dolnego, bądź górnego przybliżenia. Usuniemy niespójnośd ze zbioru NIE

IND(B) = {{1}{2,5}{3}{4}{6}} X tak = {1,2,3,4} X nie = {5,6} BX Tak = {1,3,4} BX Nie = {6} Tak =3/6 Nie =1/6 Metoda mówi, aby usunąd ten obiekt, dla którego uzyskano mniejszą dokładnośd dolnego, bądź górnego przybliżenia. Usuniemy niespójnośd ze zbioru NIE

Po usunięciu

Metoda ilościowa

Metoda uogólnionego atrybutu decyzyjnego

Redukcja atrybutów pojęcie jądra i reduktów

Inny przykład

Metoda z definicji