Plan wykładu. Rozmyte zapytania do Baz Danych. Wstęp. Wstęp informacja rozmyta. Logika rozmyta w Bazach Danych nieprecyzyjne wartości atrybutów



Podobne dokumenty
Wiedza niepewna i wnioskowanie (c.d.)

Chemoinformatyczne bazy danych - Wprowadzenie do technologii baz danych. Andrzej Bąk

dr inż. Cezary Wiśniewski Płock, 2006

Instrukcja Obsługi STRONA PODMIOTOWA BIP

Elementy cyfrowe i układy logiczne

Temat: Funkcje. Własności ogólne. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1

Dziękujemy za zainteresowanie

Harmonogramowanie projektów Zarządzanie czasem

POMOC PSYCHOLOGICZNO-PEDAGOGICZNA Z OPERONEM. Vademecum doradztwa edukacyjno-zawodowego. Akademia

1. Rozwiązać układ równań { x 2 = 2y 1

Sieci komputerowe cel

Rady Miejskiej Wodzisławia Śląskiego. w sprawie stypendiów dla osób zajmujących się twórczością artystyczną i upowszechnianiem kultury.

Projektowanie Systemów Inf.

Cennik reklam na Nyskim Portalu Internetowym

ZASTOSOWANIE TABLIC PODOBIE STW W ROZMYTYM J ZYKU ZAPYTA

Grupa bezpieczeństwa kotła KSG / KSG mini

Szkolenie instruktorów nauki jazdy Postanowienia wstępne

Strategia rozwoju kariery zawodowej - Twój scenariusz (program nagrania).

Roczne zeznanie podatkowe 2015

Podatek przemysłowy (lokalny podatek od działalności usługowowytwórczej) :02:07

Na podstawie art.4 ust.1 i art.20 lit. l) Statutu Walne Zebranie Stowarzyszenia uchwala niniejszy Regulamin Zarządu.

Twierdzenie Bayesa. Indukowane Reguły Decyzyjne Jakub Kuliński Nr albumu: 53623

Satysfakcja pracowników 2006

Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, Warszawa

WYKŁAD 8. Postacie obrazów na różnych etapach procesu przetwarzania

Bioinformatyka Laboratorium, 30h. Michał Bereta

PROCEDURA OCENY RYZYKA ZAWODOWEGO. w Urzędzie Gminy Mściwojów

PK Panie i Panowie Dyrektorzy Izb Skarbowych Dyrektorzy Urzędów Kontroli Skarbowej wszyscy

ROZPORZĄDZENIE MINISTRA ZDROWIA 1)

Wykorzystanie synergii obszarowych odpowiedzią na wzrastającą konkurencyjność rynku

Podstawowe działania w rachunku macierzowym

1. Zapewnienia wygodnej sali dydaktycznej dla średnio 14 uczestników + 2 wykładowców, wyposażonej w

Program szkoleniowy Efektywni50+ Moduł III Standardy wymiany danych

Ogólna charakterystyka kontraktów terminowych

Urządzenie do odprowadzania spalin

2) Drugim Roku Programu rozumie się przez to okres od 1 stycznia 2017 roku do 31 grudnia 2017 roku.

Warunki formalne dotyczące udziału w projekcie

UCHWAŁ A SENATU RZECZYPOSPOLITEJ POLSKIEJ. z dnia 18 października 2012 r. w sprawie ustawy o zmianie ustawy o podatku dochodowym od osób fizycznych

DE-WZP JJ.3 Warszawa,

Normy szansą dla małych przedsiębiorstw. Skutki biznesowe wdrożenia norm z zakresu bezpieczeństwa w małych firmach studium przypadków

Biznesplan - Projekt "Gdyński Kupiec" SEKCJA A - DANE WNIOSKODAWCY- ŻYCIORYS ZAWODOWY WNIOSKODAWCY SEKCJA B - OPIS PLANOWANEGO PRZEDSIĘWZIĘCIA

Zarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska

LABORATORIUM TECHNOLOGII NAPRAW WERYFIKACJA TULEJI CYLINDROWYCH SILNIKA SPALINOWEGO

MotoFocus.pl - to nowoczesne rozwiązania w badaniach marketingowych

MĄDROŚĆ, WIARA i WYCHOWANIE. Koncepcja pracy Katolickiego Gimnazjum im. św. Jadwigi Królowej w Sandomierzu na lata 2015/2020

DB Schenker Rail Polska

Zestawienie wartości dostępnej mocy przyłączeniowej źródeł w sieci RWE Stoen Operator o napięciu znamionowym powyżej 1 kv

14.Rozwiązywanie zadań tekstowych wykorzystujących równania i nierówności kwadratowe.

Uchwała nr 647/XXV/2012 Rady Miejskiej w Piasecznie z dnia r.

Projektowanie systemów autonomicznych wykorzystujących planowanie - działanie racjonalne

2.Prawo zachowania masy

Ochrona pracujących kobiet

Zastosowanie metod statystycznych do problemu ujednoznaczniania struktury zdania w języku polskim

INFORMATOR TECHNICZNY GE FANUC. Rezerwacja w sterownikach programowalnych GE Fanuc. Standby Redundancy najprostszy system rezerwacji

Wniosek o ustalenie warunków zabudowy

UCHWAŁA NR 660/2005 RADY MIEJSKIEJ W RADOMIU. z dnia roku

Finansowanie inwestycji w OZE - PO Infrastruktura i Środowisko

Opis modułu analitycznego do śledzenia rotacji towaru oraz planowania dostaw dla programu WF-Mag dla Windows.

Ustawienie wózka w pojeździe komunikacji miejskiej - badania. Prawidłowe ustawienie

Zarządzanie Zasobami by CTI. Instrukcja

Stosowanie pasów bezpieczeństwa w Polsce w 2014 roku

Polacy o źródłach energii odnawialnej

REGULAMIN SAMORZĄDU UCZNIOWSKIEGO GIMNAZJUM W ZABOROWIE UL. STOŁECZNA 182

USTAWA. z dnia 26 czerwca 1974 r. Kodeks pracy. 1) (tekst jednolity)

Innowacyjna gospodarka elektroenergetyczna gminy Gierałtowice

Warszawa, dnia 6 listopada 2015 r. Poz ROZPORZĄDZENIE MINISTRA ROLNICTWA I ROZWOJU WSI 1) z dnia 23 października 2015 r.

Uchwała nr 21 /2015 Walnego Zebrania Członków z dnia w sprawie przyjęcia Regulaminu Pracy Zarządu.

Polska-Warszawa: Usługi w zakresie doradztwa prawnego 2015/S

Stowarzyszenie Lokalna Grupa Działania EUROGALICJA Regulamin Rady

Podstawy Informatyki Gramatyki formalne

Nowości w module: BI, w wersji 9.0

Wpływ implementacji systemów GNSS na lotniskach regionalnych i lokalnych na rozwój rynku samolotów GA i System Transportu Małymi Samolotami.

Edycja geometrii w Solid Edge ST

Segmentacja i plasowanie dr Grzegorz Mazurek. Wybór rynku docelowego. Istota segmentacji

Technologie kodowania i oznaczania opakowań leków w gotowych. Koło o ISPE AMG 2007

BIZNESU I JĘZYKÓW OBCYCH

DYREKTYWA DELEGOWANA KOMISJI / /UE. z dnia r.

Adres strony internetowej, na której Zamawiający udostępnia Specyfikację Istotnych Warunków Zamówienia: bip.koweziu.edu.pl

Rozeznanie rynku na analizę merytoryczną i budżetową projektów informacyjnych poświęconych FE

LISTA DANYCH DOTYCZĄCYCH TERENU

Zakupy w supermarkecie

REGULAMIN ZATRUDNIANIA NAUCZYCIELI AKADEMICKICH W PAŃSTWOWEJ WYŻSZEJ SZKOLE ZAWODOWEJ IM. PROF. STANISŁAWA TARNOWSKIEGO W TARNOBRZEGU

REGULAMIN REKRUTACJI UCZNIÓW/SŁUCHACZY DO ZESPOŁU SZKÓŁ TECHNICZNYCH I OGÓLNOKSZTAŁCĄCYCH IM. KAZIMIERZA WIELKIEGO W BUSKU-ZDROJU

AUTOR MAGDALENA LACH

Spis treści. WD_New_000_TYT.indd :06:07

PRAWA ZACHOWANIA. Podstawowe terminy. Cia a tworz ce uk ad mechaniczny oddzia ywuj mi dzy sob i z cia ami nie nale cymi do uk adu za pomoc

Regulamin studenckich praktyk zawodowych w Państwowej Wyższej Szkole Zawodowej w Nowym Sączu

Przeciąganie Gratowanie Automatyzacja

Regulamin Zarządu Pogórzańskiego Stowarzyszenia Rozwoju

TABELA ZGODNOŚCI. W aktualnym stanie prawnym pracodawca, który przez okres 36 miesięcy zatrudni osoby. l. Pornoc na rekompensatę dodatkowych

UCHWALA NR XXXIXI210/13 RADY MIASTA LUBARTÓW. z dnia 25 września 2013 r.

oraz nowego średniego samochodu ratowniczo-gaśniczego ze sprzętem ratowniczogaśniczym

PRZEWODNIK PO PRZEDMIOCIE

ZARZĄDZENIE Nr 121/2015 Rektora Uniwersytetu Wrocławskiego z dnia 2 grudnia 2015 r.

Wykład 8 Ochrona danych wprowadzenie Sterowanie dostępem do danych Sterowanie przepływem danych Ograniczanie możliwości wnioskowania Szyfrowanie

ZESTAWIENIE INFORMACJI O WARUNKACH SPŁATY KREDYTÓW HIPOTECZNYCH WYRAŻONYCH W CHF ( )

SIECI KOMPUTEROWE I BAZY DANYCH

Dokumentacja usługi SMS (Aplikacja def3000/sms)

Transkrypt:

Rozmyte zapytania do Baz Danych Krzysztof Dembczyński Instytut Informatyki Krzysztof.Dembczynski@cs.put.poznan.pl Plan wykładu Wstęp Logika rozmyta w Bazach Danych Rozmyty Relacyjny Model Danych (RRMD) Operacje w Rozmytym Relacyjnym Modelu Danych Fuzzy SQL (SQLf) RRMD Implementacja Projekt Wstęp Tradycyjne bazy danych przechowują informację precyzyjną W świecie rzeczywistym częściej operujemy informacją nieprecyzyjną i niepewną Pozyskując wiedzę z danych precyzyjnych może nam zależeć na rozmytych odpowiedziach Wstęp informacja rozmyta Nieprecyzyjność w danych rzeczywistych Dane podawane przez czujnik mogą być reprezentowane jako pewien rozkład Subiektywny osąd Ocena filmu pewnym osobom film może się bardzo podobać, innym wręcz przeciwnie Informacja, którą jesteśmy zainteresowani może nie być precyzyjna Poszukujemy produkt nie droższy od 100 PLN, który spełnia wymogi bezpieczeństwa na poziomie lepszym niż interesującą odpowiedzią byłoby uzyskanie informacji o produkcie trochę droższym, ale o wyższym poziomie bezpieczeństwa np.cena - 105 PLN, poziom bezpieczeństwa: 5. Logika rozmyta w Bazach Danych nieprecyzyjne wartości atrybutów Przechowywanie, uaktualnianie i przetwarzanie informacji nieprecyzyjnej z natury Nieprecyzyjne wartości atrybutów Możliwość Częściowe zawieranie się krotek w relacji relacja rozmyta Przetwarzanie nieprecyzyjnych (rozmytych) zapytań dotyczy atrybutów, których dziedziny są dyskretne, określa podobieństwo między wszystkimi wartościami atrybutu (np. podobieństwo pomiędzy zawodami) Możliwość jest bardziej ogólna, może dotyczyć zarówno atrybutów ciągłych jak i dyskretnych, reprezentuje rozkład możliwości dla wartości atrybutów

relacja rozmyta W klasycznych bazach danych krotka albo występuje w danej relacji albo nie W relacjach rozmytych dana krotka może występować w jakimś stopniu występowanie częściowe, tzw. krotki ważone (ang. Weighted Tuples) rozmyte zapytania Zapytanie do Bazy Danych jest nieprecyzyjne (rozmyte) jeśli spełnia poniższe warunki: Nieprecyzyjne (rozmyte) warunki Znajdź wszystkich podatników, których zarobki były mniejsze od 0 000 PLN. Znajdź wszystkich podatników, których zarobki były małe. Nieprecyzyjne (rozmyte) operatory Znajdź wszystkie kraje, których trzy importowane dobra były takie same jak trzy eksportowane dobra przez Polskę Znajdź wszystkie kraje, których trzy importowane dobra były prawie takie same jak trzy eksportowane dobra przez Polskę Nieprecyzyjne (rozmyte) kwantyfikatory Znajdź firmy których wszyscy klienci są urzędnikami państwowymi. Znajdź firmy których prawie wszyscy klienci są urzędnikami państwowymi. redundancja i zależność funkcyjna Redundancja i zależność funkcyjna w klasycznych Bazach Danych Kiedy dwie krotki w relacji rozmytej są takie same Jak wyznaczyć zależność funkcyjną w przypadku relacji rozmytych Rozmyty Relacyjny Model Danych Atrybuty i krotki Dziedzina atrybutów może być dyskretna lub ciągła Relacja R jest podzbiorem iloczynu kartezjańskiego wszystkich kombinacji wartości na atrybutach relacji R. Nancy Wiek 2 27 40 55 Pracodawca Texas A&M Typ pracy Przemysłowy SUN Microsystems Harvard University NASA Ames Typ pracy Przemysłowy Lokalizacja Texas Boston Rozmyty Relacyjny Model Danych podobieństwo (1) Wykorzystuje się zmienne lingwistyczne do opisu wartości atrybutu (np. nazwy zawodów) Nieprecyzyjność zmiennych jest przedstawiona za pomocą macierzy podobieństwa inteligencja inteligencja podobieństwo (2) Relacja podobieństwa S na dziedzinie D jest relacją rozmytą, która przypisuje każdej parze wartości dziedziny D wartość z przedziału [0,1], tzn. S:D D [0,1]. Relacja S spełnia trzy poniższe własności dla każdego x, y, z należącego do D: zwrotność: S D (x,x)=1 symetryczność: S D (x,y) = S D (y,x) przechodniość: S D (x,z) max y D (min(s D (x,y),s D (y,z))

Logika rozmyta w Bazach Danych - możliwość Wykorzystuje się rozkład możliwości do opisu wartości atrybutu Nieprecyzyjność może być modelowana jako różnego rodzaju rozkłady możliwości Zmienna lingwistyczna Dziecko Młody Średni Dojrzały Stary Wartość 0 15 0 45 60 1,2 1 0,8 0,6 0,4 0,2 0 0 15 0 45 60 Dziecko Młody Ś redni Dojrzały Stary Operacje w Rozmytym Relacyjnym Modelu Danych (1) Rozmyta algebra relacyjna Suma µ R S (t) = µ R (t) µ S (t) Różnica µ R-S (t) = µ R (t) (1 - µ S (t)) Iloczyn kartezjański µ R S (t 12 ) = µ R (t 1 ) µ S (t 2 ) Operacje w Rozmytym Relacyjnym Modelu Danych (2) Rozmyta algebra relacyjna Projekcja Selekcja Ograniczenie za pomocą progu przynależności do relacji Wybór n krotek o największej przynależności Wyświetlenie wszystkich krotek z niezerową przynależnością Połączenie Poprzez atrybuty dyskretne oraz ciągłe µ R S (t 12 ) = min(µ R (t 1 ), µ S (t 2 ), µ θ (R.a(t 1 ), S.b(t 2 ))) gdzie R, S są relacjami rozmytymi, a,b są atrybutami połączeniowymi, a t 12 jest krotką łączącą t 1 i t 2. Operacje w rozmytym relacyjnym modelu danych () Redundancja Niech t 1 i t 2 będą dwoma krotkami w relacji o atrybutach a 1,a 2,..., a n. Stopień równości pomiędzy dwoma rozmytymi krotkami t 1 i t 2, oznaczany Equal(t 1,t 2 ), jest rozmytą koniunkcją rozmytych miar równości pomiędzy odpowiednimi wartościami atrybutów, tzn: k Equal( t1, t2) = Eq( ai ( t1), ai ( t2)) i = 1 Gdzie Eq jest odpowiednio miarą podobieństwa lub możliwości pomiędzy i-tymi wartościami atrybutu. Fuzzy SQL (1) SELECT Imie,, Wykszalcenie WHERE Wyksztalcenie = Fuzzy SQL (2) Select 0.4 Imie,, Wiek From Pracownicy Where Wiek = Średni Wiek 2 27 Możliwość 0.8 0.5

Fuzzy SQL () Select 2 Imie,, Wyksztalcenie From Pracownicy Where Wyksztalcenie = Fuzzy SQL (4) SELECT 0.7, Pracownik.Wyksztalcenie, Praca.Wyksztalcenie, Pracodawca, Lokalizacja, Praca.TypPracy WHERE Pracownicy.TypPracy = Praca.TypPracy and Pracownicy.Wyksztalcenie = Praca.Wyksztalcenie Pracownik. Praca. Pracodawca Lokalizacja Praca. TypPracy NIH DC Texas A&M Texas Systemy Ekspertowe Harvard University Boston NASA RRMD (1) Inne możliwości zapytań: SELECT 0.7 Imie,, #Wyksztalcenie Nancy RRMD (2) Rozmyte funkcje agregujące Rozmyte grupowanie SELECT count(*) GROUP BY #Wyksztalcenie Count(*) 1 RRMD () Różne reprezentacje rozkładu możliwości Możliwość definiowania relacji rozmytych typu: około, mniejsze lub równe Możliwość zastosowania algorytmów generujących reguły asocjacyjne Możliwość modelowania preferencji Implementacja Wszystko od początku Najtrudniejsze ale można najbardziej zoptymalizować Klasyczne zapytania do Bazy Danych i przetwarzanie odpowiedzi Prędkość działania, przetwarzanie na serwerze czy u klienta Translacja zapytań z Fuzzy SQL do SQL Czy jest w ogóle możliwa?

Projekt Rok temu powstały dwa konkurencyjne projekty, których idee należałoby powiązać ze sobą oraz dalej rozwinąć Lepiej zrobić jeden bardzo dobry projekt, niż 10 mało znaczących i mało rozwijających Podziękowania Dla mgr inż. Ani Pankowskiej za pomoc w przygotowaniu wykładu oraz wspólną realizację projektu Dr inż. Maciejowi Hapke za zaproszenie i umożliwienie mi wygłoszenia wykładu Kontakt Krzysztof.Dembczynski@cs.put.poznan.pl