MOśLIWOŚCI ZASTOSOWAŃ SZTUCZNYCH SYSTEMÓW IMMUNOLOGICZNYCH W OBSZARZE ZARZĄDZANIA WIEDZĄ Anna Kempa Wprowadzenie Liczne podobieństwa grup społecznych do Ŝywego organizmu zauwa- Ŝane były przez ludzi juŝ od dawna. Herbert Spencer, XIX wieczny filozof i socjolog, wymieniając w swoich pracach owe podobieństwa podał takŝe dwie róŝnice. Jedną z nich jest brak organu czucia w organizmie społecznym, natomiast drugą fakt, Ŝe podczas kiedy Ŝywe jednostki (komórki, tkanki) składając Ŝywy organizm, złączone są ze sobą stosunkiem ścisłego przylegania, to jednostki Ŝywe, wchodzące w skład grupy społecznej, nie pozostają ze sobą w zetknięciu, są rozdzielne. Jak jednak zauwaŝa, owa rozdzielność w grupach społecznych jest niejako pozorna, poniewaŝ Nie stykając się ze sobą bezpośrednio, niemniej jednak oddziaływają one [jednostki] na siebie poprzez dzielącą je przestrzeń, a to za pośrednictwem zarówno języka uczuć, jako teŝ pisanej i ustnej mowy rozumu 1. Rozwój współczesnych technologii informacyjnych i komunikacyjnych moŝe być postrzegany jako przejaw dąŝenia organizmów społecznych do zwiększenia stopnia przylegania (łączności) tworzących je jednostek. Tworzymy jeden organizm dzięki językowi uczuć, ustnej i pisanej 1 Herbert Spencer, Indukcje socjologii, rozdział II Społeczeństwo jako organizm
mowy. Jej pisana (ogólniej - rejestrowana) forma pozwala na znaczne zwiększenie zasięgu wymiany wiedzy i informacji w organizacji. Stąd i od technologii wspierających systemy zarządzania wiedzą oczekuje się zdolności do gromadzenia, przetwarzania oraz udostępniania wiedzy pracownikom, grupom pracowników oraz całej organizacji [Gołu05]. Technologiczne moŝliwości przestały zawęŝać się do pomocy w rejestrowaniu informacji i jej prostym wyszukiwaniu, a w coraz większym stopniu zaczęły rozszerzać się na pomoc w wyłuskiwaniu, kompilacji wiedzy w oparciu o znany (zaszyty) kontekst i informacje. Nowym zadaniem stało się wyposaŝenie tego coraz bardziej istotnego pośrednika w wymianie wiedzy między ludźmi maszyny w częściowe rozumienie wiedzy, jaką przechowuje. Ewolucja sieci WWW w kierunku semantycznej sieci WWW jest przykładem takich aspiracji badawczych w zakresie informatyki. Główny czynnik scalający organizmy społeczne - język jest jednocześnie główną barierą, która utrudnia porozumienie się za pośrednictwem maszyn one najlepiej rozumieją cyfry. W naturze moŝna jednak znaleźć systemy, które przetwarzają wiedzę, mimo, Ŝe brak im, charakterystycznej dla ludzkiego rozumu wiedzy wiedzy, Ŝe się wie. Obiecujące wydaje się sięganie po inspiracje w głąb organizmów Ŝywych oraz innych naturalnych systemów, w których swoista wiedza przetwarzana jest z du- Ŝą skutecznością. Biologiczną inŝynierię charakteryzuje elastyczność, odporność na niewielkie zaburzenia oraz rozproszoność, dzięki której funkcjonowanie pojedynczych komponentów nie jest krytyczne dla zachowania spójnej funkcjonalności, a ich suma tworzy całość o skomplikowanych i nowych własnościach [Wier01]. Od kilkunastu lat informaty-
cy próbują adaptować kolejny naturalny system układ odpornościowy, który wyposaŝony jest w zdolność zdobywania kwalifikacji poprzez naukę i doświadczenie. Posługuje się pamięcią, którą rozwija według zapotrzebowania, w szczególności moŝe usuwać nabyte, juŝ niepotrzebne zdolności [Wier01]. Organizm Ŝywy dysponuje repertuarem 10 6 struktur własnych. Liczbę potencjalnych struktur patogennych szacuje się na 10 16. Aby skutecznie obronić organizm układ odpornościowy musi się cały czas uczyć. Podobnie jak organizmy Ŝywe nie rodzą się z repozytorium zawierającym informacje na temat wszystkich moŝliwych wrogich struktur, tak i organizacja nigdy nie będzie mogła stworzyć repozytorium zawierającego wiedzę na temat wszystkich problemów, jakie moŝe napotkać. Układ odpornościowy, w chwili pojawienia się problemu (patogenu) dokonuje selekcji komórek najlepiej znających się na nim (dopasowanych), w dalszej części usiłuje poprawić kwalifikacje ekspertów, a gdy juŝ są doskonali klonuje ich na duŝą skalę. W organizacjach jest podobnie, zamiast klonowania ekspertów, klonuje się ich wiedzę rozszerza na zakres pracowników, potrzebnych do rozwiązania danego problemu. Wychodząc od prezentowanej metafory systemów zarządzania wiedzą, przedstawione zostaną naturalne oraz sztuczne systemy immunologiczne i ich predyspozycje do zastosowań w systemach wspierających zarządzanie wiedzą.
Naturalne systemy immunologiczne Immunologia jest nauką z pogranicza medycyny i biologii, której przedmiotem badań jest odporność organizmów na zarazki, toksyny i niektóre substancje chemiczne. Chęć zrozumienia makroskopowych własności układu odpornościowego zrodziła powstanie odrębnej jej gałęzi - immunologii matematycznej. Układ odpornościowy jako efektywny system rozproszonego przetwarzania informacji, posiadający zdolność uczenia się i adaptacji do zmiennego otoczenia jest atrakcyjny takŝe i dla informatyków. Układ odpornościowy charakteryzują [Wier01]: Rozproszona detekcja. Detektory nieustannie monitorują stan komórek organizmu, krąŝąc wewnątrz naczyń krwionośnych, limfatycznych oraz pokonując tkankowe przestrzenie międzykomórkowe. Proces detekcji nie podlega scentralizowanemu sterowaniu. KaŜdy element wie co i w jakich sytuacjach ma robić, Progowa detekcja. Proces wiązania antygenu przez przeciwciało opiera się na częściowym podobieństwie obu elementów (przypomina to progową aktywację pojedynczego neuronu), Detekcja anomalii. Układ potrafi prawidłowo identyfikować patogeny, z którymi nigdy wcześniej się nie zetknął, Adaptacyjność. Układ immunologiczny potrafi nauczyć się i zapamiętać patogenne struktury. Pamięć immunologiczna jest zorganizowana bardzo efektywnie, rzadko uŝywane informacje są z niej usuwane, Samoorganizacja. Pamięć immunologiczna tworzy sieciową strukturę (sieć idiotypową), która podlega modyfikacjom w miarę pojawiania się kolejnych typów patogenów,
Brak konieczności negatywnych przykładów. Do podjęcia akcji obronnej wystarcza znajomość struktur własnych komórek. Przykłady moŝliwych patogenów (przykłady negatywne) nie są potrzebne, Prostota reprezentacji. Wiedza gromadzona przez układ odpornościowy reprezentowana jest w bezpośredni sposób przez struktury detektorów uczestniczących w rozpoznawaniu patogenów, Unikalność. Układ odpornościowy kaŝdego osobnika jest inny, a osobniki róŝnią się odpornością na zewnętrzne zagroŝenia. Rys. 1 Wielowarstwowa struktura układu immunologicznego Źródło: [CaZu99] Układ odpornościowy ma budowę wielowarstwową, poszczególne warstwy róŝnią się stopniem skomplikowania stosowanych mechanizmów obronnych. Pierwszą warstwę stanowi skóra, kolejną są bariery
fizjologiczne (temperatura organizmu, ph, łzy, itp). Trzecią warstwą jest wrodzony układ odpornościowy, nie podlega on Ŝadnym zmianom, jego zadaniem jest natychmiastowe działanie obronne, w przypadku niektórych patogenów moŝe być wystarczające. Czwartą, ostatnią warstwę stanowi układ adaptacyjny (rys.1). Trzy pierwsze warstwy stanowią odporność nieswoistą, natomiast ostatnia adaptacyjny system obronny stanowi odporność swoistą. Odporność swoistą cechuje uczenie się rozpoznawania patogenów, proces uczenia zachodzi w tzw. pierwotnej odpowiedzi na patogen, czyli wówczas, gdy organizm zetknął się z nim po raz pierwszy. Odpowiedź pierwotna jest na ogół wolna (ok. kilka dni od zaraŝenia), ale układ zachowuje pamięć o pokonanym patogenie, dzięki czemu w zetknięciu się z nim w przyszłości odpowie znacznie szybciej. Jest to tzw. wtórna reakcja immunologiczna. Komórki, które aktywnie uczestniczą w swoistej odpowiedzi immunologicznej nazywane są limfocytami. Limfocyty są wyspecjalizowanymi wszechobecnymi komórkami, rozproszonymi w płynach ustrojowych i tkankach lub tworzącymi własne narządy, centralne i obwodowe. Komórek tych jest w organizmie aŝ 10 12, co stanowi ok. 1% masy całego ciała. Limfocyty współpracują podczas detekcji oraz usuwania antygenów (patogeny rozpoznawane przez limfocyty nazywane są antygenami). Limfocyty dzieli się na limfocyty typu B oraz limfocyty typu T. Limfocyty T stanowią wielozadaniową populację inicjującą i koordynującą przebieg odpowiedzi immunologicznej, w której uczestniczą takŝe komórki wykonawcze, m.in. limfocyty B. Limfocyty B produkują przeciwciała (immunoglobuliny), a w dojrzałym stadium zmieniają się w komórki
pamięciowe. Limfocyty B uczestniczą w tzw. odpowiedzi humoralnej, w wyniku zetknięcia się z antygenem, po kooperacji z limfocytami T klonują się, co powoduje powstawanie komórek intensywnie produkujących przeciwciała. Limfocyty T i B posiadają receptory swoiste detektory odpowiedzialne za rozpoznawanie antygenów. Przedstawiona zostanie budowa receptorów limfocytów B, których struktura ma szczególne znaczenie przy konstrukcji sztucznych systemów immunologicznych. Na powierzchni limfocytu B moŝe być około 100 tysięcy receptorów (przeciwciał). Przeciwciała kształtem przypominają literę Y. Fragment receptora, który słuŝy do identyfikacji molekuł nazywany jest paratopem. Natomiast fragment receptora lub antygenu, do którego moŝe się przyłączyć paratop nazywany jest epitopem. Siłę wiązania epitop-paratop nazywa się stopniem dopasowania. Zachowanie limfocytu jest uzaleŝnione od dopasowania jego receptorów. Limfocyt ulega aktywacji gdy stopień dopasowania osiąga pewną wartość progową oraz gdy dostatecznie duŝa ilość paratopów związała epitopy. Układ immunologiczny wyposaŝony jest w zdolność uczenia się konkretnych struktur epitopów i zapamiętywania ich w celu szybkiej reakcji przy powtórnym kontakcie z antygenem. Za oba te mechanizmy odpowiedzialne są limfocyty B. Uaktywnione limfocyty B po przedostaniu się do węzłów limfatycznych produkują (poprzez podział) wiele krótko Ŝyjących klonów. Klony podlegają hipermutacji somatycznej, co ma prowadzić do wyprodukowania paratopów moŝliwie najlepiej dostosowanych do epitopów atakujących organizm antygenów. Proces ten przypomina
mutację genetyczną, jednak jego intensywność jest znacznie większa. Ten etap jest określany jako proliferacja. Rys. 2 Mechanizm selekcji klonalnej Źródło: [Hord03] Klony są testowane pod względem skuteczności antygenów (selekcja klonalna), klony nieefektywne są usuwane z organizmu, natomiast klony dobrze dopasowane do antygenu przeŝywają, a po pewnym czasie zmieniają się w komórki plazmatyczne lub pamięciowe (proces dyferencjacji). Komórki plazmatyczne produkują wolne przeciwciała, które łącząc się z antygenem wskazują go komórkom Ŝernym do eliminacji. Z kolei komórki pamięciowe pozostają w organizmie przez dłuŝszy czas i biorą aktywny udział we wtórnej odpowiedzi immunologicznej. Omówione procesy zostały przedstawione na Rys.2. Produkowane limfocyty podlegają takŝe
selekcji negatywnej, której zadaniem jest niedopuszczenie do działania limfocytów rozpoznających struktury własne jako antygeny (obce). Sztuczne Systemy Immunologiczne Sztuczny system immunologiczny (SSI, ang. Artificial Immune System) to program komputerowy, którego działanie opiera się na najbardziej fundamentalnych regułach sterujących populacją limfocytów w organizmach Ŝywych [Wier01]. Struktura sztucznego systemu immunologicznego opiera się trzech podstawowych elementach [CaTi03]: Reprezentacja komponentów systemu (abstrakcyjny model immunologicznych organów, komórek, molekuł), Zbiór mechanizmów obliczania miary interakcji pomiędzy komponentami systemu (m.in. funkcje dopasowania), Procedury adaptacji, których rolą jest zarządzanie dynamiką systemu. Reprezentacja komponentów systemu. Podobnie jak w naturalnym systemie immunologicznym podstawowymi komponentami SSI są struktury reprezentujące limfocyty (zarówno B i T, częściej jednak spotyka się systemy oparte jedynie na limfocytach B). Sztuczne limfocyty B posiadają tylko jedno przeciwciało, przez co oba pojęcia bywają utoŝsamiane. Odpowiednikiem struktur molekularnych przeciwciał są w SSI struktury elementów ze zbioru cech odzwierciedlającego dziedzinę problemu, mogą to być wektory liczb, ciągi binarne oraz złoŝone struktury (np. listy obiektów). Wektory liczb rzeczywistych stosowane są w SSI realizujących zadania obliczeniowe, takie jak interpolacja funkcji lub optymalizacja problemów kombinatorycznych. Ciągi binarne uŝywane są w systemach roz-
poznawania wzorców oraz systemach ochrony przed wirusami. Natomiast złoŝone struktury stosuje się w technologii data mining. Miary dopasowania. Dobór metody obliczania dopasowania zaleŝy od charakterystyki problemu oraz reprezentacji komponentów systemu, większość z nich opiera się na koncepcji przestrzeni kształtów (ang. shape-spaces) [CaTo03]. W naturalnym systemie immunologicznym dopasowanie przeciwciała do antygenu jest determinowane przez siły elektrostatyczne, wiązania wodorowe, oddziaływania hydrofobowe i siły van der Waalsa [Wier01]. W koncepcji przestrzeni kształtów, wszystkie determinanty wpływające na siłę wiązania przeciwciało-antygen określa się uogólnionym kształtem molekuły. Dla n determinant przestrzeń jest n- wymiarowa, a kaŝdy punkt w tej przestrzeni reprezentuje uogólniony kształt receptora przeciwciała lub antygenu. Obszar V wokół punktu reprezentującego antygen, w którym znajdują się przeciwciała zdolne do jego rozpoznania nazywa się sąsiedztwem rozpoznania, średnica tego obszaru stanowi próg dopasowania ε, który określa stopień tolerancji niedoskonałości podobieństwa antygen-przeciwciało. Stosowane są tu róŝne miary odległości np. euklidesowej, Hamminga lub Manhattan. Algorytmy immunologiczne stanowią odpowiednik realizacji procesów adaptacji i dywersyfikacji naturalnego systemu immunologicznego. Ich zadaniem jest, poprzez sterowanie populacją przeciwciał, doprowadzić do otrzymania rozwiązania. Algorytmy immunologiczne moŝna podzielić na populacyjne i sieciowe (sieć idiotypowa). Algorytmy populacyjne to selekcja klonalna oraz selekcja negatywna (stosuje się takŝe metody hybrydowe, będącymi połączeniem wymienionych algorytmów z
innymi metodami sztucznej inteligencji, m.in. algorytmami genetycznymi). Algorytmy sieciowe dzielą się na modele ciągłe oraz dyskretne. Algorytm selekcji klonalnej (CLONALG) składa się z dwóch etapów ekspansji klonalnej oraz hipermutacji. Pierwszy odpowiedzialny jest za wyselekcjonowanie najlepiej dopasowanych przeciwciał i ich sklonowanie. Hipermutacja natomiast realizuje dojrzewanie przeciwciał w celu jeszcze lepszego ich dopasowania. Schemat algorytmu przedstawia się w krokach [CaTi03]: 1. Generacja populacji początkowej przeciwciał, 2. Selekcja przeciwciał z najlepszym dopasowaniem, 3. Klonowanie przeciwciał w ilości proporcjonalnej do stopnia dopasowania, 4. Hipermutacja przeciwciał z czynnikiem zmienności odwrotnie proporcjonalnym do stopnia dopasowania, 5. Ponowny wybór najlepiej dopasowanych przeciwciał, 6. Wymiana najgorzej dopasowanych przeciwciał na nowe. Algorytm selekcji negatywnej stosuje się w celu wyeliminowania przeciwciał, które rozpoznają własne struktury jako obce. Algorytm ten znajduje zastosowanie najczęściej w problemach detekcji anomalii. Ogólny schemat algorytmu [CaTi03]: 1. Generacja populacji początkowej przeciwciał, 2. Określenie dopasowania wszystkich przeciwciał względem zbioru wzorców struktur własnych, 3. Jeśli stopień dopasowania przekracza pewien próg przeciwciało jest usuwane, w przeciwnym razie zasila zbiór wynikowy detektorów.
Model sieci idiotypowej proponuje system immunologiczny charakteryzujący się dynamicznym działaniem nawet w przypadku braku antygenów obcych. Model ten róŝni się od selekcji klonalnej i negatywnej, czyniąc limfocyty B zdolne do rozpoznawania siebie nawzajem. Pierwsze sieciowe modele opierały się głównie na zbiorze równań róŝniczkowych sterujących zmianami w populacji molekuł przeciwciał i limfocytów B. Podejście to nazywane jest ciągłym modelem sieci idiotypowej, wykorzystywane jest szeroko w robotyce, optymalizacji oraz kontroli, a takŝe analizie danych [CaTi03]. Późniejsze modele, których nie oparto na równaniach róŝniczkowych, ale interaktywnych procedurach adaptacji nazwano dyskretnymi modelami sieci idiotypowej. Znajdują one zastosowania głownie w problemach rozpoznawania obrazów, analizie danych, maszynowym uczeniu oraz optymalizacji [CaTi03]. Obszary zastosowań SSI w systemach zarządzania wiedzą Układ odpornościowy klasyfikuje dowolną strukturę do jednej z dwóch klas: własny lub obcy. Zakwalifikowanie do obcych pociąga za sobą reakcje mające na celu eliminacje zagroŝenia. Traktując obcą strukturę jako problem, jaki naleŝy rozwiązać, a uruchomienie akcji obronnej jako jego rozwiązanie, moŝna dostrzec, Ŝe immunologia stanowi interesujący obszar dla badaczy i twórców systemów wspomagających rozwiązywanie problemów. Przykładowo, dla problemu optymalizacyjnego, traktowanego jako patogen poszukuje się wiąŝących go przeciwciał zbioru rozwiązań tego zadania. Natomiast w przypadku analizy danych, patogenami mogą być zbiory danych, ich rozpoznanie i zapamiętanie jest
równowaŝne utworzeniu wewnętrznego obrazu patogenów. Przy pomocy sieci idiotypowej moŝna otrzymać strukturę (w postaci grafu) reprezentującą istotne relacje między poszczególnymi danymi [Wier01]. Owocne moŝe być takŝe połączenie mechanizmów SSI z innymi metodami sztucznej inteligencji. Z informatycznego punktu widzenia SSI łączą w sobie cechy wnioskowania na podstawie przypadków, sieci neuronowych, systemów klasyfikujących i samoorganizujących się systemów analizy danych [Wier01]. Jest ponadto blisko spokrewniony z algorytmami ewolucyjnymi i logiką rozmytą. W rezultacie interdyscyplinarnych badań modele SSI uŝywane są jako nowe podejścia wspierające rozwój sieci neuronowych, algorytmów ewolucyjnych, logiki rozmytej i viceversa. Sieć idiotypową moŝna wykorzystać takŝe jako narzędzie słuŝące do organizacji bazy przypadków w metodologii Case-Based Reasoning (opracowano przy pomocy tego połączenia m.in. system słuŝący do profilowania klientów [Wier01]). Do głównych zadań technologicznej warstwy systemu zarządzania wiedzą naleŝą: okrywanie wiedzy z baz danych, dokumentów tekstowych i graficznych, reprezentacja wiedzy czytelnej zarówno dla człowieka jak i komputera (ontologia), przetwarzanie tekstów w języku naturalnym, wspomaganie elektronicznej współpracy, lokalizacji wiedzy oraz uczenia się, personalizacja prezentacji wiedzy [Gołu05]. SSI jako przedstawiciele systemów poznawczych są predysponowane do wspierania większości wymienionych zadań. ZauwaŜalne wysiłki poczyniono na obszarze zastosowań SSI w data mining, grupowaniu danych, personalizacji, analizie danych oraz systemach wieloagentowych.
Obiecujące wydaje się wykorzystanie SSI w najnowszym kierunku rozwoju systemów zarządzania wiedzą, opartym na koncepcji sieci semantycznych. Ten obszar badawczy jest jak na razie w niewielkim stopniu rozpoznany, ale pierwsze próby w tym zakresie, a takŝe znajomość zdolności SSI jest wystarczającą zachętą do działań w tym kierunku. Literatura [CaTi03] Castro L.N., Timmis J.I.: Artificial Immune System as Novel Soft Computing Paradigm, Soft Computing 7, Springer-Verlag 2003 [CaZu99] Castro L.N., Zuben F.J.: Artificial Immune System. Part I Basic Theory and Applications, Technical Report, 12 1999 [Gołu05] Gołuchowski J.: Technologie informatyczne w zarządzaniu wiedzą w organizacji, AE Katowice, 2005 [Hord03] Hordjewicz T.: Sztuczne systemu immunologiczne i ich zastosowanie w systemach rekomendujących, w: Hołubica J. (red) Analiza systemowa w finansach i zarządzaniu, Instytut Badań Systemowych PAN, Warszawa 2005 [Wier01] Wierzchoń S.T.: Sztuczne systemy immunologiczne. Teoria i zastosowania, AOW Exit, Warszawa 2001 mgr Anna Kempa Katedra Informatyki Akademia Ekonomiczna 40-226 Katowice, ul. Bogucicka 3 Numer telefonu (fax) +48/32/2577294 e-mail: kempa@ae.katowice.pl