Sztuczne Systemy Skojarzeniowe SSS Relacje Bazodanowe czy Asocjacje AGDS? DB Relations v AGDS Associations? Adrian Horzyk horzyk@agh.edu.pl AGH Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i Inżynierii Biomedycznej Laboratorium Biocybernetyki 30-059 Kraków, al. Mickiewicza 30, paw. C3/05
CO REPREZENTOWAĆ, ŻEBY WNIOSKOWAĆ? Wiedza i inteligencja pozwalają nam wnioskować oraz podejmować decyzje dzięki odpowiedniemu powiązaniu/skojarzeniu danych i możliwości wykorzystania tych powiązań/skojarzeń w przyszłości: Relacyjne bazy danych umożliwiają horyzontalne powiązanie atrybutów danych poprzez relacje. Systemy asocjacyjne umożliwiają horyzontalne i wertykalne powiązanie danych. POWIĄZANIA I WNIOSKOWANIE ASOCJACYJNE RELACYJNE
Problem BIG DATA Problem BIG DATA kładzie współczesną informatykę na łopatki, lecz to problem relacyjnych baz danych oraz struktur liniowych! BIG DATA is caused by BIG NUMBER of unrepresented relations between data that are hardly to find and mine. Dlaczego ludzki umysł radzi sobie z napływem BIG DATA codziennie i bez większego wysiłku? Dlatego że struktury asocjacyjne, takie jak w ludzkim mózgu i całym układzie nerwowym, reprezentują też relacje wertykalne, które nie trzeba czasochłonnie i żmudnie wyszukiwać, szczególnie, że ich przybywa wraz z rozmiarem danych! Chcąc więc poradzić sobie z problemem BIG DATA skutecznie musimy zmienić podejście do przetwarzania danych oraz ich reprezentacji w systemach informatycznych tak, żeby odwzorowywać od razu w strukturze te relacje, a nie tracić czas i pieniądze na ich wyszukiwanie. Jeśliby nasz umysł miał przeszukiwać wszystkie zapamiętane obiekty w trakcie podejmowania decyzji, wtedy byśmy zamarli na bardzo długo zanim bylibyśmy w stanie wykonać jakikolwiek sensowny ruch.
Problem Reprezentacji Wiedzy Problem reprezentacji wiedzy we współczesnych systemach informatycznych również bierze się z braku reprezentacji relacji wertykalnych pomiędzy danymi, odpowiedniej asocjacyjnej agregacji danych, obiektów i konsolidacji ich sekwencji i grafów! Wiedza oraz możliwość wnioskowania biorą się właśnie z możliwości wykorzystania równocześnie relacji horyzontalnych i wertykalnych pomiędzy danymi, gdyż one kryją bogactwo skojarzeń naszego umysłu. Jeśli więc wykorzystywana struktura danych reprezentuje tylko ubogi zbiór relacji pomiędzy danymi obiektami, wtedy większość problemów związanych z wnioskowaniem staje się obliczeniowo trudna O(n!). Jeśli zaś wykorzystamy odpowiednie struktury asocjacyjne, które reprezentują odpowiednie bogactwo relacji pomiędzy danymi, wtedy nie musimy wyszukiwać relacji, badać różnych kombinacji, wariacji, permutacji, warunków i wtedy też wiele zadań staje się obliczeniowo łatwymi, zwykle o złożoności stałej O(1) lub liniowej O(n). Winowajcą jest tutaj mało efektywny liniowy model obliczeniowy z roku 1936, na którym nadal jeszcze bazują współczesne komputery maszyna Turinga.
Problem Sztucznej Inteligencji Problem stworzenia sztucznej inteligencji jest oczywiście również związany z tymi zagadnieniami, gdyż inteligencja potrzebuje dobrego modelu wiedzy, aby mogła efektywnie, poprawnie i automatycznie wnioskować! Alan Turing był nie wątpliwie bardzo mądrym człowiekiem i stworzył wiele przydatnych rozwiązań oraz zawdzięczamy mu współczesne komputery i sprzęt elektroniczny, z którego chętnie korzystamy i dzięki któremu rozwinęła się nasza cywilizacja. Jednak model maszyny Turinga nie rozwiąże nam problemu BIG DATA, problemu formowania i reprezentacji wiedzy, ani nie doprowadzi do powstania sztucznej inteligencji. Czy rzeczywiście wierzymy, że tasiemka z głowicą może mieć (od)ruchy inteligentne? Możliwość operowania na liczbach i symbolach? to za mało do stworzenia maszyn dysponujących wiedzą i inteligencją
Transformacja powiązanych tabel do AGDS Relacyjne bazy danych (obecnie najczęściej stosowane na świecie) służą do przechowywania danych, ich rekordów oraz relacji pomiędzy ich atrybutami. UWAGA: nie danymi lecz ich atrybutami! Przez to zmuszeni jesteśmy do czasochłonnego przeszukiwania danych w celu odnalezienia wertykalnych relacji pomiędzy danymi, np.: poszukiwanie minimów, maksimów, średnich, median, sum, odchyleń, podobieństw, różnic, danych odstających, duplikatów, grup/klas itp. to wszystko przykłady operacji wynikających z relacji wertykalnych. Transformacja relacyjnych tabel bazodanowych do struktur asocjacyjnych automatycznie wydobywa (automatic mining) z danych relacje wertykalne pomiędzy nimi, upraszczając i przyspieszając eksplorację danych, wnioskowanie, grupowanie, klasyfikację oraz przeszukiwanie. Struktury AGDS pozwalają również na asocjacyjną reprezentację wielu tabel powiązanych relacjami (przy pomocy kluczy głównych i obcych). W wyniku asocjacyjnej agregacji wielu danych z wielu tabel powstaje jeden spójny graf AGDS (lub struktura neuronowa) reprezentujący/a asocjacyjne związki (relacje) z wszystkich tabel łącznie i równocześnie.
ASOCJACYJNA TRANSFORMACJA RELACYJNYCH BAZ DANYCH DO AGDS To proces po części przypominający normalizację, gdyż w trakcie tego procesu dochodzi do agregacji duplikatów danych dla poszczególnych atrybutów, jak również do agregacji duplikatów całych obiektów lub ich składowych. Celem tego procesu jest otrzymanie grafowej struktury AGDS lub aktywnych asocjacyjnych grafów neuronowych AANG albo sztucznych systemów skojarzeniowych AAS, które na tej strukturze bazują i ją wzbogacają. Struktury skojarzeniowe AGDS reprezentują wiele relacji wertykalnych, których nie znajdziemy w relacyjnych BD, ale nie oznacza to, iż poprzez taką transformację uzyskamy automatycznie wszystkie przydatne relacje pomiędzy obiektami. To już zadanie dla systemów AAS
Relacyjne BD Asocjacyjne AGDS Mamy relacyjną bazę danych i schemat relacji pomiędzy atrybutami danych: Mamy też tabele wypełnione danymi, a tabele są powiązane relacjami: Dokonując asocjacyjnej transformacji tej bazy z automatycznym wydobyciem pozostałych relacji pomiędzy danymi: Zamieniamy wszystkie unikalne wartości danych na wierzchołki (receptory) połączone z węzłem reprezentującym atrybut (pole sensoryczne), czyli: Imię, Nazwisko, Stypendium, Rok studiów, Miasto, Ulica, Numer i Nazwa kierunku. W przypadku istnienia porządku na danych wiążemy je dodatkowo połączeniami odwzorowującymi ich kolejność (nadajemy wagi połączeniom). Wszystkie klucze główne przekształcamy w węzły (neurony), które łączymy z odpowiednimi węzłami (receptorami) atrybutów reprezentującymi wartości danych oraz z odpowiednimi węzłami (neuronami) reprezentującymi rekordy w innych tabelach. Przekształcenie robimy od tabel reprezentujących relacje po stronie jeden (Adres i Kierunek) do tabel reprezentujących relacje po stronie wielu (Studenci). Jeśli wszystkie tabele są powiązane relacjami, wtedy powstanie spójny pasywny graf AGDS lub aktywną sieć neuronowa AANG asocjacyjnie reprezentujące bazę danych.
Relacyjne BD Asocjacyjne AGDS Dokonujemy transformacji A1: Miasto R=3 A3: Numer Kraków 18 3 A5: Imię 5 Anna Beata Jan A6: Nazwisko Katarzyna Sebastian Konieczny Kowalski Małecka Nowicka Rybicki Sodej Wesołowska Wybicka S S5 A3 S6 S1 A S7 A A1 S3 S8 A5 Bronowicka Piastowska A: Ulica Reymonta S9 S Automatyka i Robotyka Informatyka Inżynieria Biomedyczna A: Kierunek Elektrotechnika 700 800 A7: Stypendium 900 1000 100 R=500 3 A8: Rok studiów R=
Asocjacyjną transformację rozpoczynamy od tabel reprezentujących wartości atrybutów, następnie te, które z nich korzystają itd. A1: Miasto A3: Numer R=3 Kraków 18 3 5 A A3 A1 A A5 Automatyka i Robotyka Informatyka Inżynieria Biomedyczna Elektrotechnika Bronowicka Piastowska Reymonta A: Kierunek A: Ulica
Podaj wszystkich studentów, którzy: studiują AiR, mieszkają na Reymonta, mają stypendium 1000zł, są na roku studiów, mieszkają razem, mają imieniny w tym samym dniu Odpowiedzi na pytania można udzielić szybko! A1: Miasto R=3 A3: Numer Kraków 18 3 A5: Imię 5 Anna Beata Jan A6: Nazwisko Katarzyna Sebastian Konieczny Kowalski Małecka Nowicka Rybicki Sodej Wesołowska Wybicka S S5 A3 S6 S1 A S7 A A1 S3 S8 A5 Bronowicka Piastowska A: Ulica Reymonta S9 S Automatyka i Robotyka Informatyka Inżynieria Biomedyczna A: Kierunek Elektrotechnika 700 800 A7: Stypendium 900 1000 100 R=500 3 A8: Rok studiów R=
Możemy odpowiadać równie łatwo na bardziej skomplikowane pytania: Którzy studenci mieszkający na Reymonta są na 3. roku studiów i biorą stypendium 800zł? Porównaj złożoność takich operacji z bazami danych. A1: Miasto R=3 A3: Numer Kraków 18 3 A5: Imię 5 Anna Beata Jan A6: Nazwisko Katarzyna Sebastian Konieczny Kowalski Małecka Nowicka Rybicki Sodej Wesołowska Wybicka S S5 A3 S6 S1 A S7 A A1 S3 S8 A5 Bronowicka Piastowska A: Ulica Reymonta S9 S Automatyka i Robotyka Informatyka Inżynieria Biomedyczna A: Kierunek Elektrotechnika 700 800 A7: Stypendium 900 1000 100 R=500 3 A8: Rok studiów R=
Relacyjna BD Asocjacyjne AGDS Aktywne AANG Które relacje wertykalne pojawiły nam się w grafie? A1: Miasto Kraków MIN A3: Numer 18 3 SA1 SA3 SA3 SA3 SA3 min Krak SA3 18 3 R=3 5 MAX SA3 5 SA3 max Anna Beata SA5 SA5 Ann Be A5: Imię Jan Katarzyna SA5 SA5 Jan Kat Sebastian Konieczny Kowalski Małecka SA5 Se Ko Kon A6: Nazwisko Nowicka Rybicki Mał No Ry Sodej Wesołowska Wybicka So We S S5 A3 S6 S1 A Wy S7 A A1 S3 S9 S8 A5 S SA SA SA Bronowicka Piastowska A: Ulica Reymonta Bro Pia.8 SA AiR SA Inf SA IB Automatyka i Robotyka Informatyka Inżynieria Biomedyczna A: Kierunek SA Ele Elektrotechnika SA7 SA7 SA7 MIN 700 800 A7: Stypendium 900 min SA7 700 800 900 SA7 1000 SA7 100 SA7 max 1000 100 MAX R=500 SA8 min SA8 SA8 3 SA8 SA8 max MIN 3 MAX A8: Rok studiów R=
ASOCJACJE SĄ TAK BOGATE JAK CHCEMY Asocjacje mogą reprezentować dowolne relacje pomiędzy obiektami oraz umożliwić szybkie wnioskowanie. Powiązania asocjacyjne umożliwiają nam przechodzenie od danych definiujących obiekty do obiektów i vice versa oraz pomiędzy podobnymi danymi, obiektami. Wszystkie powiązania asocjacyjne dostępne są od razu, tzn. bez szukania, bez sprawdzania kombinacji, bez pętli Trzeba przejść tylko po odpowiednich połączeniach. Dzięki temu drastycznie maleje czas potrzebny na wykonanie takich operacji, co jest związane ze znaczącym się zmniejszeniem złożoności obliczeniowej, zwykle do poziomu złożoności stałej lub maksymalnie liniowej. ASOCJACYJNE WNIOSKOWANIE
BIBLIOGRAFIA 1. Horzyk, A., How Does Generalization and Creativity Come into Being in Neural Associative Systems and How Does It Form Human-Like Knowledge?, Neurocomputing, 01, IF = 1,63.. Horzyk, A., Human-Like Knowledge Engineering, Generalization and Creativity in Artificial Neural Associative Systems, Springer Verlag, AISC 11156, ISSN 19-5357, DOI 10.1007/978-3-319-19090-7, Springer, Switzerland, 016, pp. 39-51. 3. Horzyk, A., Innovative Types and Abilities of Neural Networks Based on Associative Mechanisms and a New Associative Model of Neurons - referat na zaproszenie na międzynarodowej konferencji ICAISC 015, Springer Verlag, LNAI, 015.. Horzyk, A., Sztuczne systemy skojarzeniowe i asocjacyjna sztuczna inteligencja, EXIT, Warszawa, 013. 5. Tadeusiewicz, R., Horzyk, A., Man-Machine Interaction Improvement by Means of Automatic Human Personality Identification, Gerhard Goos, Juris Hartmanis, and Jan van Leeuwen (Eds.), Springer, LNCS 810, 013. 6. Horzyk, A., Gadamer, M., Associative Text Representation and Correction, Springer Verlag Berlin Heidelberg, LNAI 789, 013, pp. 76-87. 7. Horzyk, A., Information Freedom and Associative Artificial Intelligence, Springer Verlag Berlin Heidelberg, LNAI 767, 01, pp. 81-89. 8. Horzyk, A., Self-Optimizing Neural Network 3, L. Franco, D. Elizondo, J.M. Jerez (eds.), Constructive Neural Networks, Springer, Series: Studies in Computational Intelligence, Vol. 58, 009, pp. 83-101. 9. Dudek-Dyduch, E., Tadeusiewicz, R., Horzyk, A., Neural Network Adaptation Process Effectiveness Dependent of Constant Training Data Availability, Neurocomputing 7, 009, pp. 3138-319, IF = 1,0. horzyk@agh.edu.pl