Adrian Horzyk

Podobne dokumenty
Adrian Horzyk

Sztuczne Systemy Skojarzeniowe. Adrian Horzyk

SZTUCZNA INTELIGENCJA

WIEDZA METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

BAZY DANYCH NORMALIZACJA BAZ DANYCH. Microsoft Access. Adrian Horzyk. Akademia Górniczo-Hutnicza

BAZY DANYCH. NIERELACYJNE BAZY DANYCH NoSQL I ASOCJACYJNE STRUKTURY DANYCH. Adrian Horzyk. Akademia Górniczo-Hutnicza

Adrian Horzyk

WSTĘP I TAKSONOMIA METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

SZTUCZNA INTELIGENCJA

METODY INŻYNIERII WIEDZY ASOCJACYJNA REPREZENTACJA POWIĄZANYCH TABEL I WNIOSKOWANIE IGOR CZAJKOWSKI

BAZY DANYCH NORMALIZACJA BAZ DANYCH. Microsoft Access. Adrian Horzyk. Akademia Górniczo-Hutnicza

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING

TRANSFORMACJE I JAKOŚĆ DANYCH

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. EKSPLORACJA DANYCH Ćwiczenia. Adrian Horzyk. Akademia Górniczo-Hutnicza

METODY INŻYNIERII WIEDZY

METODY INŻYNIERII WIEDZY

PROLOG WSTĘP DO INFORMATYKI. Akademia Górniczo-Hutnicza. Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej.

METODY INŻYNIERII WIEDZY

Metody Inżynierii Wiedzy

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Neuroasocjacyjne modele obliczeniowe w sztucznej inteligencji dla celów formowania się wiedzy i skojarzeń

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING

ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej

Praca dyplomowa magisterska

WSTĘP DO INFORMATYKI. Drzewa i struktury drzewiaste

BAZY DANYCH. Microsoft Access NAWIGACJA, MENU I PARAMETRY WYSZUKIWANIA. Adrian Horzyk. Akademia Górniczo-Hutnicza

1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda

WSTĘP DO INFORMATYKI. Struktury liniowe

Baza danych. Modele danych

PODSTAWY INFORMATYKI wykład 5.

SZTUCZNA INTELIGENCJA

Adrian Horzyk Web: Google: Adrian Horzyk Gabinet: paw. C3 p. 206

Bazy danych TERMINOLOGIA

BAZY DANYCH MAKRA I PRZYCISKI. Microsoft Access. Adrian Horzyk. Akademia Górniczo-Hutnicza

Diagramy związków encji. Laboratorium. Akademia Morska w Gdyni

BIOCYBERNETYKA PROLOG

Stefan Sokołowski SZTUCZNAINTELIGENCJA. Inst. Informatyki UG, Gdańsk, 2009/2010

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Wykład wprowadzający

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,

ZAGADNIENIA DO EGZAMINU DYPLOMOWEGO NA STUDIACH INŻYNIERSKICH. Matematyka dyskretna, algorytmy i struktury danych, sztuczna inteligencja

Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na

KARTA KURSU. Seminarium dziedzinowe 2: Kryptografia i sztuczna inteligencja

Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi

Podstawowe zagadnienia z zakresu baz danych

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Wprowadzenie do teorii systemów ekspertowych

Technologia informacyjna

Modelowanie hierarchicznych struktur w relacyjnych bazach danych

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE

BAZY DANYCH. Microsoft Access. Adrian Horzyk OPTYMALIZACJA BAZY DANYCH I TWORZENIE INDEKSÓW. Akademia Górniczo-Hutnicza

ID1SIII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Wykład I. Wprowadzenie do baz danych

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

Sprawozdanie z laboratorium 2: Modeling knowledge with Resource Description Framework (RDF)

Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych

Wprowadzenie do baz danych

Technologia informacyjna

PODSTAWY BAZ DANYCH. 5. Modelowanie danych. 2009/ Notatki do wykładu "Podstawy baz danych"

WYDZIAŁ INFORMATYKI POLITECHNIKI POZNAŃSKIEJ

Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Normalizacja baz danych

PRZEWODNIK PO PRZEDMIOCIE

Specjalizacja magisterska Bazy danych

Wprowadzenie do baz danych

Grupy pytań na egzamin inżynierski na kierunku Informatyka

Lista przedmiotów prowadzonych przez pracowników Zakładu Sieci i Systemów Elektroenergetycznych

BAZY DANYCH. Microsoft Access. Adrian Horzyk OPTYMALIZACJA BAZY DANYCH I TWORZENIE INDEKSÓW. Akademia Górniczo-Hutnicza

Analiza i wizualizacja danych Data analysis and visualization

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

Books edited by professor Ryszard Tadeusiewicz

2

Relacyjny model baz danych, model związków encji, normalizacje

Rok akademicki: 2014/2015 Kod: EAR s Punkty ECTS: 1. Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne

Praca dyplomowa magisterska

Technologie baz danych

Bazy danych - wykład wstępny

W poszukiwaniu sensu w świecie widzialnym

PRZEDMIOTY REALIZOWANE W RAMACH KIERUNKU INFORMATYKA I STOPNIA STUDIA STACJONARNE

LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS

Transformacja modelu ER do modelu relacyjnego

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

Syste t m e y m ek e s k per pe to t w o e w Wykład 8 1

Grupa kursów: Wykład Ćwiczenia Laboratorium Projekt Seminarium 15 30

prowadzący dr ADRIAN HORZYK /~horzyk tel.: Konsultacje paw. D-13/325

Systemy GIS Systemy baz danych

Analiza możliwości szacowania parametrów mieszanin rozkładów prawdopodobieństwa za pomocą sztucznych sieci neuronowych 4

Wydział Inżynierii Wytwarzania AGH w Mielcu

WSTĘP DO INFORMATYKI SIECI NEURONOWE I SZTUCZNA INTELIGENCJA wykład

PODSTAWOWE POJĘCIA BAZ DANYCH

Sztuczna inteligencja

Algorytm. Krótka historia algorytmów

Kraków, 14 marca 2013 r.

Wykład 2. Relacyjny model danych

Informatyka Ćwiczenie 10. Bazy danych. Strukturę bazy danych można określić w formie jak na rysunku 1. atrybuty

Transkrypt:

Sztuczne Systemy Skojarzeniowe SSS Relacje Bazodanowe czy Asocjacje AGDS? DB Relations v AGDS Associations? Adrian Horzyk horzyk@agh.edu.pl AGH Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i Inżynierii Biomedycznej Laboratorium Biocybernetyki 30-059 Kraków, al. Mickiewicza 30, paw. C3/05

CO REPREZENTOWAĆ, ŻEBY WNIOSKOWAĆ? Wiedza i inteligencja pozwalają nam wnioskować oraz podejmować decyzje dzięki odpowiedniemu powiązaniu/skojarzeniu danych i możliwości wykorzystania tych powiązań/skojarzeń w przyszłości: Relacyjne bazy danych umożliwiają horyzontalne powiązanie atrybutów danych poprzez relacje. Systemy asocjacyjne umożliwiają horyzontalne i wertykalne powiązanie danych. POWIĄZANIA I WNIOSKOWANIE ASOCJACYJNE RELACYJNE

Problem BIG DATA Problem BIG DATA kładzie współczesną informatykę na łopatki, lecz to problem relacyjnych baz danych oraz struktur liniowych! BIG DATA is caused by BIG NUMBER of unrepresented relations between data that are hardly to find and mine. Dlaczego ludzki umysł radzi sobie z napływem BIG DATA codziennie i bez większego wysiłku? Dlatego że struktury asocjacyjne, takie jak w ludzkim mózgu i całym układzie nerwowym, reprezentują też relacje wertykalne, które nie trzeba czasochłonnie i żmudnie wyszukiwać, szczególnie, że ich przybywa wraz z rozmiarem danych! Chcąc więc poradzić sobie z problemem BIG DATA skutecznie musimy zmienić podejście do przetwarzania danych oraz ich reprezentacji w systemach informatycznych tak, żeby odwzorowywać od razu w strukturze te relacje, a nie tracić czas i pieniądze na ich wyszukiwanie. Jeśliby nasz umysł miał przeszukiwać wszystkie zapamiętane obiekty w trakcie podejmowania decyzji, wtedy byśmy zamarli na bardzo długo zanim bylibyśmy w stanie wykonać jakikolwiek sensowny ruch.

Problem Reprezentacji Wiedzy Problem reprezentacji wiedzy we współczesnych systemach informatycznych również bierze się z braku reprezentacji relacji wertykalnych pomiędzy danymi, odpowiedniej asocjacyjnej agregacji danych, obiektów i konsolidacji ich sekwencji i grafów! Wiedza oraz możliwość wnioskowania biorą się właśnie z możliwości wykorzystania równocześnie relacji horyzontalnych i wertykalnych pomiędzy danymi, gdyż one kryją bogactwo skojarzeń naszego umysłu. Jeśli więc wykorzystywana struktura danych reprezentuje tylko ubogi zbiór relacji pomiędzy danymi obiektami, wtedy większość problemów związanych z wnioskowaniem staje się obliczeniowo trudna O(n!). Jeśli zaś wykorzystamy odpowiednie struktury asocjacyjne, które reprezentują odpowiednie bogactwo relacji pomiędzy danymi, wtedy nie musimy wyszukiwać relacji, badać różnych kombinacji, wariacji, permutacji, warunków i wtedy też wiele zadań staje się obliczeniowo łatwymi, zwykle o złożoności stałej O(1) lub liniowej O(n). Winowajcą jest tutaj mało efektywny liniowy model obliczeniowy z roku 1936, na którym nadal jeszcze bazują współczesne komputery maszyna Turinga.

Problem Sztucznej Inteligencji Problem stworzenia sztucznej inteligencji jest oczywiście również związany z tymi zagadnieniami, gdyż inteligencja potrzebuje dobrego modelu wiedzy, aby mogła efektywnie, poprawnie i automatycznie wnioskować! Alan Turing był nie wątpliwie bardzo mądrym człowiekiem i stworzył wiele przydatnych rozwiązań oraz zawdzięczamy mu współczesne komputery i sprzęt elektroniczny, z którego chętnie korzystamy i dzięki któremu rozwinęła się nasza cywilizacja. Jednak model maszyny Turinga nie rozwiąże nam problemu BIG DATA, problemu formowania i reprezentacji wiedzy, ani nie doprowadzi do powstania sztucznej inteligencji. Czy rzeczywiście wierzymy, że tasiemka z głowicą może mieć (od)ruchy inteligentne? Możliwość operowania na liczbach i symbolach? to za mało do stworzenia maszyn dysponujących wiedzą i inteligencją

Transformacja powiązanych tabel do AGDS Relacyjne bazy danych (obecnie najczęściej stosowane na świecie) służą do przechowywania danych, ich rekordów oraz relacji pomiędzy ich atrybutami. UWAGA: nie danymi lecz ich atrybutami! Przez to zmuszeni jesteśmy do czasochłonnego przeszukiwania danych w celu odnalezienia wertykalnych relacji pomiędzy danymi, np.: poszukiwanie minimów, maksimów, średnich, median, sum, odchyleń, podobieństw, różnic, danych odstających, duplikatów, grup/klas itp. to wszystko przykłady operacji wynikających z relacji wertykalnych. Transformacja relacyjnych tabel bazodanowych do struktur asocjacyjnych automatycznie wydobywa (automatic mining) z danych relacje wertykalne pomiędzy nimi, upraszczając i przyspieszając eksplorację danych, wnioskowanie, grupowanie, klasyfikację oraz przeszukiwanie. Struktury AGDS pozwalają również na asocjacyjną reprezentację wielu tabel powiązanych relacjami (przy pomocy kluczy głównych i obcych). W wyniku asocjacyjnej agregacji wielu danych z wielu tabel powstaje jeden spójny graf AGDS (lub struktura neuronowa) reprezentujący/a asocjacyjne związki (relacje) z wszystkich tabel łącznie i równocześnie.

ASOCJACYJNA TRANSFORMACJA RELACYJNYCH BAZ DANYCH DO AGDS To proces po części przypominający normalizację, gdyż w trakcie tego procesu dochodzi do agregacji duplikatów danych dla poszczególnych atrybutów, jak również do agregacji duplikatów całych obiektów lub ich składowych. Celem tego procesu jest otrzymanie grafowej struktury AGDS lub aktywnych asocjacyjnych grafów neuronowych AANG albo sztucznych systemów skojarzeniowych AAS, które na tej strukturze bazują i ją wzbogacają. Struktury skojarzeniowe AGDS reprezentują wiele relacji wertykalnych, których nie znajdziemy w relacyjnych BD, ale nie oznacza to, iż poprzez taką transformację uzyskamy automatycznie wszystkie przydatne relacje pomiędzy obiektami. To już zadanie dla systemów AAS

Relacyjne BD Asocjacyjne AGDS Mamy relacyjną bazę danych i schemat relacji pomiędzy atrybutami danych: Mamy też tabele wypełnione danymi, a tabele są powiązane relacjami: Dokonując asocjacyjnej transformacji tej bazy z automatycznym wydobyciem pozostałych relacji pomiędzy danymi: Zamieniamy wszystkie unikalne wartości danych na wierzchołki (receptory) połączone z węzłem reprezentującym atrybut (pole sensoryczne), czyli: Imię, Nazwisko, Stypendium, Rok studiów, Miasto, Ulica, Numer i Nazwa kierunku. W przypadku istnienia porządku na danych wiążemy je dodatkowo połączeniami odwzorowującymi ich kolejność (nadajemy wagi połączeniom). Wszystkie klucze główne przekształcamy w węzły (neurony), które łączymy z odpowiednimi węzłami (receptorami) atrybutów reprezentującymi wartości danych oraz z odpowiednimi węzłami (neuronami) reprezentującymi rekordy w innych tabelach. Przekształcenie robimy od tabel reprezentujących relacje po stronie jeden (Adres i Kierunek) do tabel reprezentujących relacje po stronie wielu (Studenci). Jeśli wszystkie tabele są powiązane relacjami, wtedy powstanie spójny pasywny graf AGDS lub aktywną sieć neuronowa AANG asocjacyjnie reprezentujące bazę danych.

Relacyjne BD Asocjacyjne AGDS Dokonujemy transformacji A1: Miasto R=3 A3: Numer Kraków 18 3 A5: Imię 5 Anna Beata Jan A6: Nazwisko Katarzyna Sebastian Konieczny Kowalski Małecka Nowicka Rybicki Sodej Wesołowska Wybicka S S5 A3 S6 S1 A S7 A A1 S3 S8 A5 Bronowicka Piastowska A: Ulica Reymonta S9 S Automatyka i Robotyka Informatyka Inżynieria Biomedyczna A: Kierunek Elektrotechnika 700 800 A7: Stypendium 900 1000 100 R=500 3 A8: Rok studiów R=

Asocjacyjną transformację rozpoczynamy od tabel reprezentujących wartości atrybutów, następnie te, które z nich korzystają itd. A1: Miasto A3: Numer R=3 Kraków 18 3 5 A A3 A1 A A5 Automatyka i Robotyka Informatyka Inżynieria Biomedyczna Elektrotechnika Bronowicka Piastowska Reymonta A: Kierunek A: Ulica

Podaj wszystkich studentów, którzy: studiują AiR, mieszkają na Reymonta, mają stypendium 1000zł, są na roku studiów, mieszkają razem, mają imieniny w tym samym dniu Odpowiedzi na pytania można udzielić szybko! A1: Miasto R=3 A3: Numer Kraków 18 3 A5: Imię 5 Anna Beata Jan A6: Nazwisko Katarzyna Sebastian Konieczny Kowalski Małecka Nowicka Rybicki Sodej Wesołowska Wybicka S S5 A3 S6 S1 A S7 A A1 S3 S8 A5 Bronowicka Piastowska A: Ulica Reymonta S9 S Automatyka i Robotyka Informatyka Inżynieria Biomedyczna A: Kierunek Elektrotechnika 700 800 A7: Stypendium 900 1000 100 R=500 3 A8: Rok studiów R=

Możemy odpowiadać równie łatwo na bardziej skomplikowane pytania: Którzy studenci mieszkający na Reymonta są na 3. roku studiów i biorą stypendium 800zł? Porównaj złożoność takich operacji z bazami danych. A1: Miasto R=3 A3: Numer Kraków 18 3 A5: Imię 5 Anna Beata Jan A6: Nazwisko Katarzyna Sebastian Konieczny Kowalski Małecka Nowicka Rybicki Sodej Wesołowska Wybicka S S5 A3 S6 S1 A S7 A A1 S3 S8 A5 Bronowicka Piastowska A: Ulica Reymonta S9 S Automatyka i Robotyka Informatyka Inżynieria Biomedyczna A: Kierunek Elektrotechnika 700 800 A7: Stypendium 900 1000 100 R=500 3 A8: Rok studiów R=

Relacyjna BD Asocjacyjne AGDS Aktywne AANG Które relacje wertykalne pojawiły nam się w grafie? A1: Miasto Kraków MIN A3: Numer 18 3 SA1 SA3 SA3 SA3 SA3 min Krak SA3 18 3 R=3 5 MAX SA3 5 SA3 max Anna Beata SA5 SA5 Ann Be A5: Imię Jan Katarzyna SA5 SA5 Jan Kat Sebastian Konieczny Kowalski Małecka SA5 Se Ko Kon A6: Nazwisko Nowicka Rybicki Mał No Ry Sodej Wesołowska Wybicka So We S S5 A3 S6 S1 A Wy S7 A A1 S3 S9 S8 A5 S SA SA SA Bronowicka Piastowska A: Ulica Reymonta Bro Pia.8 SA AiR SA Inf SA IB Automatyka i Robotyka Informatyka Inżynieria Biomedyczna A: Kierunek SA Ele Elektrotechnika SA7 SA7 SA7 MIN 700 800 A7: Stypendium 900 min SA7 700 800 900 SA7 1000 SA7 100 SA7 max 1000 100 MAX R=500 SA8 min SA8 SA8 3 SA8 SA8 max MIN 3 MAX A8: Rok studiów R=

ASOCJACJE SĄ TAK BOGATE JAK CHCEMY Asocjacje mogą reprezentować dowolne relacje pomiędzy obiektami oraz umożliwić szybkie wnioskowanie. Powiązania asocjacyjne umożliwiają nam przechodzenie od danych definiujących obiekty do obiektów i vice versa oraz pomiędzy podobnymi danymi, obiektami. Wszystkie powiązania asocjacyjne dostępne są od razu, tzn. bez szukania, bez sprawdzania kombinacji, bez pętli Trzeba przejść tylko po odpowiednich połączeniach. Dzięki temu drastycznie maleje czas potrzebny na wykonanie takich operacji, co jest związane ze znaczącym się zmniejszeniem złożoności obliczeniowej, zwykle do poziomu złożoności stałej lub maksymalnie liniowej. ASOCJACYJNE WNIOSKOWANIE

BIBLIOGRAFIA 1. Horzyk, A., How Does Generalization and Creativity Come into Being in Neural Associative Systems and How Does It Form Human-Like Knowledge?, Neurocomputing, 01, IF = 1,63.. Horzyk, A., Human-Like Knowledge Engineering, Generalization and Creativity in Artificial Neural Associative Systems, Springer Verlag, AISC 11156, ISSN 19-5357, DOI 10.1007/978-3-319-19090-7, Springer, Switzerland, 016, pp. 39-51. 3. Horzyk, A., Innovative Types and Abilities of Neural Networks Based on Associative Mechanisms and a New Associative Model of Neurons - referat na zaproszenie na międzynarodowej konferencji ICAISC 015, Springer Verlag, LNAI, 015.. Horzyk, A., Sztuczne systemy skojarzeniowe i asocjacyjna sztuczna inteligencja, EXIT, Warszawa, 013. 5. Tadeusiewicz, R., Horzyk, A., Man-Machine Interaction Improvement by Means of Automatic Human Personality Identification, Gerhard Goos, Juris Hartmanis, and Jan van Leeuwen (Eds.), Springer, LNCS 810, 013. 6. Horzyk, A., Gadamer, M., Associative Text Representation and Correction, Springer Verlag Berlin Heidelberg, LNAI 789, 013, pp. 76-87. 7. Horzyk, A., Information Freedom and Associative Artificial Intelligence, Springer Verlag Berlin Heidelberg, LNAI 767, 01, pp. 81-89. 8. Horzyk, A., Self-Optimizing Neural Network 3, L. Franco, D. Elizondo, J.M. Jerez (eds.), Constructive Neural Networks, Springer, Series: Studies in Computational Intelligence, Vol. 58, 009, pp. 83-101. 9. Dudek-Dyduch, E., Tadeusiewicz, R., Horzyk, A., Neural Network Adaptation Process Effectiveness Dependent of Constant Training Data Availability, Neurocomputing 7, 009, pp. 3138-319, IF = 1,0. horzyk@agh.edu.pl