DWUFAZOWY ALGORYTM DOPASOWANIA W POSZUKIWANIU PODOBIEŃSTWA STRUKTUR BIAŁKOWYCH

Podobne dokumenty
Problem plecakowy (KNAPSACK PROBLEM).

Wykład 2: Uczenie nadzorowane sieci neuronowych - I

Wykład 2: Uczenie nadzorowane sieci neuronowych - I

Grupowanie dokumentów XML ze względu na ich strukturę, z wykorzystaniem XQuery

Zarządzanie ryzykiem w przedsiębiorstwie i jego wpływ na analizę opłacalności przedsięwzięć inwestycyjnych

ANALIZA PREFERENCJI SŁUCHACZY UNIWERSYTETU TRZECIEGO WIEKU Z WYKORZYSTANIEM WYBRANYCH METOD NIESYMETRYCZNEGO SKALOWANIA WIELOWYMIAROWEGO

Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

SZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW

Evaluation of estimation accuracy of correlation functions with use of virtual correlator model

WikiWS For Business Sharks

Za: Stanisław Latoś, Niwelacja trygonometryczna, [w:] Ćwiczenia z geodezji II [red.] J. Beluch

Krzysztof Borowski Zastosowanie metody wideł cenowych w analizie technicznej

Wykład 1 Zagadnienie brzegowe liniowej teorii sprężystości. Metody rozwiązywania, metody wytrzymałości materiałów. Zestawienie wzorów i określeń.

Wielokategorialne systemy uczące się i ich zastosowanie w bioinformatyce. Rafał Grodzicki

Zaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych

Rozwiązywanie zadań optymalizacji w środowisku programu MATLAB

Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD A

BADANIA OPERACYJNE. Podejmowanie decyzji w warunkach niepewności. dr Adam Sojda

Sortowanie szybkie Quick Sort

STATECZNOŚĆ SKARP. α - kąt nachylenia skarpy [ o ], φ - kąt tarcia wewnętrznego gruntu [ o ],

ZESZYTY NAUKOWE INSTYTUTU POJAZDÓW 2(88)/2012

KRZYWA BÉZIERA TWORZENIE I WIZUALIZACJA KRZYWYCH PARAMETRYCZNYCH NA PRZYKŁADZIE KRZYWEJ BÉZIERA

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

ZASTOSOWANIE KLASYCZNEGO ALGORYTMU GENETYCZNEGO DO ROZWIĄZANIA ZBILANSOWANEGO ZAGADNIENIA TRANSPORTOWEGO

Zapis informacji, systemy pozycyjne 1. Literatura Jerzy Grębosz, Symfonia C++ standard. Harvey M. Deitl, Paul J. Deitl, Arkana C++. Programowanie.

OPTYMALIZACJA ALGORYTMÓW WYZNACZANIA RUCHU CIECZY LEPKIEJ METODĄ SZTUCZNEJ ŚCIŚLIWOŚCI

RÓWNOWAGA STACKELBERGA W GRACH SEKWENCYJNYCH

Zmodyfikowana technika programowania dynamicznego

I. Elementy analizy matematycznej

ZESZYTY NAUKOWE INSTYTUTU POJAZDÓW 5(96)/2013

Twierdzenie Bezouta i liczby zespolone Javier de Lucas. Rozwi azanie 2. Z twierdzenia dzielenia wielomianów, mamy, że

Zadanie 1. Udowodnij, że CAUS PRAM. Załóżmy przetwarzanie przyczynowo spójne. Dla każdego obrazu historii hv i zachodzi zatem:

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

OPTYMALIZACJA WARTOŚCI POLA MAGNETYCZNEGO W POBLIŻU LINII NAPOWIETRZNEJ Z WYKORZYSTANIEM ALGORYTMU GENETYCZNEGO

OKREŚLENIE CZASU MIESZANIA WIELOSKŁADNIKOWEGO UKŁADU ZIARNISTEGO PODCZAS MIESZANIA Z RECYRKULACJĄ SKŁADNIKÓW

Sztuczne sieci neuronowe

XXX OLIMPIADA FIZYCZNA ETAP III Zadanie doświadczalne

(M2) Dynamika 1. ŚRODEK MASY. T. Środek ciężkości i środek masy

O PEWNYM MODELU POZWALAJĄCYM IDENTYFIKOWAĆ K NAJBARDZIEJ PODEJRZANYCH REKORDÓW W ZBIORZE DANYCH KSIĘGOWYCH W PROCESIE WYKRYWANIA OSZUSTW FINANSOWYCH

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

WPŁYW PARAMETRÓW DYSKRETYZACJI NA NIEPEWNOŚĆ WYNIKÓW POMIARU OBIEKTÓW OBRAZU CYFROWEGO

ZASTOSOWANIE ANALIZY HARMONICZNEJ DO OKREŚLENIA SIŁY I DŁUGOŚCI CYKLI GIEŁDOWYCH

Prawdziwa ortofotomapa

Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA

Badania operacyjne w logistyce i zarządzaniu produkcją

Wielokryterialny Trójwymiarowy Problem Pakowania

RUCH OBROTOWY Można opisać ruch obrotowy ze stałym przyspieszeniem ε poprzez analogię do ruchu postępowego jednostajnie zmiennego.

ZESTAW ZADAŃ Z INFORMATYKI

Dobór procesora sygnałowego w konstrukcji regulatora optymalnego

STARE A NOWE KRAJE UE KONKURENCYJNOŚĆ POLSKIEGO EKSPORTU

5. OPTYMALIZACJA GRAFOWO-SIECIOWA

BADANIE DRGAŃ WŁASNYCH NAPĘDU ROBOTA KUCHENNEGO Z SILNIKIEM SRM

RÓWNOLEGŁY ALGORYTM POPULACYJNY DLA PROBLEMU GNIAZDOWEGO Z RÓWNOLEGŁYMI MASZYNAMI

KINEMATYKA MANIPULATORÓW

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

u u u( x) u, x METODA RÓŻNIC SKOŃCZONYCH, METODA ELEMENTÓW BRZEGOWYCH i METODA ELEMENTÓW SKOŃCZONYCH

OPTYMALNE STRATEGIE INWESTYCYJNE PODEJŚCIE FUNDAMENTALNE OPTIMAL INVESTMENT STRATEGY FUNDAMENTAL ANALYSIS

-Macierz gęstości: stany czyste i mieszane (przykłady) -równanie ruchu dla macierzy gęstości -granica klasyczna rozkładów kwantowych

7. Wykład VII: Warunki Kuhna-Tuckera

WSKAŹNIK OCENY HIC SAMOCHODU OSOBOWEGO W ASPEKCIE BEZPIECZEŃSTWA RUCHU DROGOWEGO

Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Diagonalizacja macierzy kwadratowej

Podstawy teorii falek (Wavelets)

Zastosowanie symulatora ChemCad do modelowania złożonych układów reakcyjnych procesów petrochemicznych

Analiza ryzyka jako instrument zarządzania środowiskiem

Proste modele ze złożonym zachowaniem czyli o chaosie

Przykład 5.1. Kratownica dwukrotnie statycznie niewyznaczalna

3. ŁUK ELEKTRYCZNY PRĄDU STAŁEGO I PRZEMIENNEGO

KURS STATYSTYKA. Lekcja 1 Statystyka opisowa ZADANIE DOMOWE. Strona 1

EKONOMETRIA I Spotkanie 1, dn

1. Komfort cieplny pomieszczeń

APROKSYMACJA QUASIJEDNOSTAJNA

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

ANALIZA PORÓWNAWCZA WYNIKÓW UZYSKANYCH ZA POMOCĄ MIAR SYNTETYCZNYCH: M ORAZ PRZY ZASTOSOWANIU METODY UNITARYZACJI ZEROWANEJ

Weryfikacja hipotez dla wielu populacji

Analiza ryzyka kosztowego robót remontowo-budowlanych w warunkach niepełnej informacji

Minister Edukacji Narodowej Pani Katarzyna HALL Ministerstwo Edukacji Narodowej al. J. Ch. Szucha Warszawa Dnia 03 czerwca 2009 r.

Programowanie Równoległe i Rozproszone

Analiza porównawcza rozwoju wybranych banków komercyjnych w latach

PROGNOZOWANIE SPRZEDAŻY Z ZASTOSOWANIEM ROZKŁADU GAMMA Z KOREKCJĄ ZE WZGLĘDU NA WAHANIA SEZONOWE

Multifraktalne cechy przep³ywu lokalnej sejsmicznoœci indukowanej na terenie KWK Katowice (GZW)

Regulamin promocji 14 wiosna

Dotyczy: opinii PKPP lewiatan do projektow dwoch rozporzqdzen z 27 marca 2012 (pismo P-PAA/137/622/2012)

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Laboratorium ochrony danych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Proces narodzin i śmierci

Urządzenia wejścia-wyjścia

Grupowanie. Wprowadzenie. Metody hierarchiczne. Modele mieszane (mixture models) Metody najmniejszych kwadratów. Zastosowania

PODSTAWA WYMIARU ORAZ WYSOKOŚĆ EMERYTURY USTALANEJ NA DOTYCHCZASOWYCH ZASADACH

65120/ / / /200

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

9 konkurs ICT Objective: 9.11 FET Proactive Neuro-bio. 9 konkurs ICT

Model ASAD. ceny i płace mogą ulegać zmianom (w odróżnieniu od poprzednio omawianych modeli)

Wyznaczanie lokalizacji obiektu logistycznego z zastosowaniem metody wyważonego środka ciężkości studium przypadku

Kształtowanie się firm informatycznych jako nowych elementów struktury przestrzennej przemysłu

11/22/2014. Jeśli stała c jest równa zero to takie gry nazywamy grami o sumie zerowej.

ANALIZA WARIANCJI (ANOVA) Spis treści

Ćwiczenie 10. Metody eksploracji danych

Transkrypt:

STUIA INFORMATICA 2012 Volume 33 Number 2A (105) Adam KRYGOWSKI, Bożena MAŁYSIAK-MROZEK, arusz MROZEK Poltechnka Śląska, Instytut Informatyk WUFAZOWY ALGORYTM OPASOWANIA W POSZUKIWANIU POOBIEŃSTWA STRUKTUR BIAŁKOWYCH Streszczene. Poszukwane podobeństwa strukturalnego bałek est ednym z kluczowych, a zarazem trudnych zadań współczesne bonformatyk strukturalne. Bogata przestrzeń poszukwań oraz różnorodność cech strukturalnych funkconalnych bałek sprawaą, że powstae wele algorytmów poszukwana podobeństwa bałek, których dzałane opera sę na różnych cechach reprezentatywnych. W nneszym artykule przedstawono nowy, dwufazowy algorytm dopasowana struktur bałkowych, wykorzystywany w poszukwanu podobeństwa bałek. Słowa kluczowe: bonformatyka, dopasowane, bałka, struktura, podobeństwo TWO-PHA ALIGNMENT ALGORITHM FOR PROTEIN STRUCTURE SIMILARITY ARCHING Summary. Proten structure smlarty searchng s one of the key, and yet dffcult tasks of modern structural bonformatcs. A reach exploraton space and a wde varety of structural and functonal features of protens caused the development of many algorthms of proten smlarty searchng, whose actvty s based on varous representatve characterstcs. In ths paper, we present a new, two-phase algorthm for matchng proten structures used n the proten smlarty searchng. Keywords: structural bonformatcs, algnment, proten structure, smlarty 1. Wprowadzene Bonformatyka strukturalna est gałęzą klasyczne bonformatyk zamuącą sę tworzenem rozwązań nformatycznych w odnesenu do przestrzennych struktur molekularnych cząstek bologcznych, takch ak bałka, kwasy NA RNA. Koncentrue sę ona zatem na tworzenu narzędz ogólnego przeznaczena, operuących na bardzo dużym pozome szcze-

526 A. Krygowsk, B. Małysak-Mrozek,. Mrozek gółowośc eśl chodz o budowę samych cząstek bologcznych, a manowce na pozome poszczególnych atomów. Przynos to ogromną nadzeę, że w nedaleke przyszłośc możlwe stane sę bardzo precyzyne analzowane skomplkowanych systemów bologcznych oraz dagnozowane efektów mutac genetycznych na pozome molekularnym. Podczas gdy analza genetyczna pozwala śledzć, ak est zwązek pomędzy sekwencą genetyczną a wynkaącym z tego skutkam dla funkconowana organzmu, bonformatyka strukturalna umożlwa wgląd w mechanzmy tych konsekwenc bologcznych, a co za tym dze w daleko dące zrozumene, ake funkce bologczne wypływaą ze struktury cząsteczk [1]. Poszukwane podobeństwa strukturalnego bałek est ednym z trudneszych zadań współczesne bonformatyk strukturalne. Jednocześne est to zadane nezwykle ważne. O le poszukwane podobeństwa sekwencynego bałek (na pozome struktury perwszorzędowe) sprowadza sę zwykle do przeprowadzena operac na łańcuchach tekstowych, o tyle problematyczność porównana struktur wynka ze skomplkowane budowy bałek na pozome molekularnym. Na rysunku 1 zaprezentowano przykładową, skomplkowaną strukturę atomową domen bałkowych BAR1 BRCT [2] (PB I: 2NTE) z bazy Proten ata Bank [3]. Jeśl przymemy, że średne welkośc bałko est zbudowane z klkuset amnokwasów, a każdy z amnokwasów est zbudowany z klkunastu atomów, to porównane wyłączne pary struktur bałkowych stae sę ne lada wyzwanem. Jeśl dodatkowo chcelbyśmy porównać strukturę danego bałka z całą bazą danych bałek, na przykład w celu porównana zmutowanych struktur, to borąc pod uwagę rosnącą lczbę struktur bałkowych w bazach danych, takch ak Proten ata Bank (PB) zadane to komplkue sę eszcze bardze. Poszukwane podobeństwa strukturalnego bałek est ednak zadanem bardzo ważnym dla współczesne bolog porównawcze. a) b) c) Rys. 1. Różne sposoby reprezentac struktury przykładowego bałka 2NTE z bazy PB: a) atomy wązana, b) struktury drugorzędowe, c) szkelet poprowadzony przez pozyce węgla C Fg. 1. Varous representatons of sample proten structure 2NTE from PB: a) atoms and bonds, b) secondary structures, c) backbone through C carbon postons

wufazowy algorytm dopasowana w poszukwanu podobeństwa 527 Na podstawe nformac o zblżone budowe bałek można wnoskować o wspólnym pochodzenu organzmów w konsekwenc poznać ewolucę organzmów na przestrzen mlonów lat. Analza struktur przez ch porównane umożlwa równeż poszukwane substytutów dla molekuł bologcznych o kluczowym znaczenu dla wybranych procesów komórkowych, a których nedobór lub neodpowedna budowa może powodować dysfunkce organzmu lub poważne choroby. W nneszym artykule przedstawono nowy algorytm dwufazowego dopasowana pary struktur bałkowych, który est używany w poszukwanu podobeństwa strukturalnego bałek. Przedstawony algorytm wcąż pozostae w faze testowana, ednakże na chwlę obecną dae bardzo dobre wynk dzałana. Autorzy przedstawl przebeg algorytmu oraz przeprowadzone testy nad skutecznoścą ego dzałana. 2. Konkurencyne rozwązana W ostatnch dwóch dekadach powstało klka algorytmów poszukwana podobeństwa strukturalnego bałek, np. VAST [4], ALI [5], LOCK2 [6], FATCAT [7], CTSS [8], CE [9]. Ze względu na złożoność struktur bałkowych, zbudowanych z tysęcy atomów, algorytmy te operaą sę na różne reprezentac struktur przestrzennych w procese poszukwana podobeństwa. Na przykład w algorytme CTSS uwzględnono lokalne cechy geometryczne oraz wybrane cechy bologczne. la każdego bałka konstruowana est sygnatura kształtu (ang. shape sgnature), na którą składa sę krzywa aproksymuąca pozyce węgl C, natomast dla każde reszty amnokwasowe oblczana est krzywzna (ang. curvature) oraz wartośc kątów torsynych, włączana est równeż nformaca o type struktury drugorzędowe. Algorytm ALI stosue w procese porównana tzw. macerze odległośc, które budue dla każdego z pary porównywanych bałek. W każde komórce macerzy przechowywana est odległość pomędzy węglam C amnokwasów oraz w bałku. Macerze odległośc są następne dekomponowane na tzw. wzorce kontaktów (ang. contact patterns), będące fragmentam macerzy o wymarach 6 x 6, porównywane w celu znalezena nalepszego dopasowana. Z kole w algorytme VAST w określenu podobeństwa wykorzystue sę elementy struktury drugorzędowe (ang. secondary structure elements), tworzące rdzene porównywanych bałek (-helsy -kartk). Elementy S są następne odwzorowywane na wektory reprezentatywne, dzęk czemu upraszcza sę proces analzy. Podczas porównana algorytm podemue próbę dopasowana zboru wektorów dla par struktur bałkowych. Podczas takego dopasowana brany est pod uwagę: typ struktury reprezentowane przy pomocy wektora, względna orentaca wektorów oraz uporządkowane wektorów.

528 A. Krygowsk, B. Małysak-Mrozek,. Mrozek Kompletne nne podeśce zastosowano w rozwanym przez autorów w ubegłych latach algorytme EAST [10] ego późneszych modyfkacach [11, 12, 13]. Algorytm EAST opera sę na reprezentac struktury bałek w postac tzw. charakterystyk energetycznych, wyznaczanych na podstawe położena atomów w strukturze. Następne dopasowane wybranych charakterystyk energetycznych odzwercedla dopasowane struktur bałkowych. 3. Ops algorytmu dopasowana Poszukwane podobeństwa bałek est zwykle realzowane przez porównane zadanego przez użytkownka bałka kwerendowego z kolenym bałkam z bazy danych. W nneszym rozdzale zostane przedstawone dzałane algorytmu porównana dwóch struktur bałkowych. Porównane to zostane zrealzowane przy wzęcu pod uwagę różnych pozomów opsu struktury bałka. W trakce porównana wśród cech reprezentatywnych struktur znalazły sę cechy trzech pozomów organzac struktur bałkowych struktury: perwszorzędowe, drugorzędowe trzecorzędowe. 3.1. Reprezentaca bałek w procese porównana Przymmy następuące oznaczena: struktura bałka kwerendowego o długośc q reszt (amnokwasów); struktura bałka z bazy danych o długośc d reszt (amnokwasów). Struktury w perwszym etape dzałana algorytmu opsywane są za pomocą zredukowanych łańcuchów struktur drugorzędowych, uawnaących rodzae struktur drugorzędowych występuących w bałku: gdze: 1, 2,..., n, (1) to -ty element struktury drugorzędowe bałka, a n to lczba struktur drugorzędowych w łańcuchu kwerendowym, n q, gdze: 1, 2,..., m, (2) to -ty element struktury drugorzędowe bałka, a m to lczba struktur drugorzędowych w łańcuchu z bazy danych, m d. Elementy, zwane dale także regonam lub fragmentam, zbudowane są z grup sąsaduących ze sobą amnokwasów o te same strukturze drugorzędowe, np. 6 amnokwasów o strukturze helsy alfa występuących obok sebe tworzy edną strukturę

wufazowy algorytm dopasowana w poszukwanu podobeństwa 529 typu helsa alfa. Stąd też na tym etape całkowte struktury bałek są określone przez zredukowane łańcuchy struktur drugorzędowych. W drugm etape dopasowywana bałka opsywane są w bardze szczegółowy sposób na wyższym pozome rozdzelczośc kolene amnokwasy bałek opsywane są przy pomocy wybranych, charakterystycznych cech strukturalnych. Bałka reprezentowane są w postac łańcuchów: gdze: s1, s2,..., q s, (3) s to -ta sygnatura strukturalna w strukturze bałka kwerendowego, odpowadaąca -temu amnokwasow w łańcuchu tego bałka, a q to długość łańcucha kwerendowego w resztach (amnokwasach); gdze: s1, s2,..., d s, (4) s to -ta sygnatura strukturalna w strukturze bałka z bazy danych, odpowadaąca -temu amnokwasow w łańcuchu tego bałka, a d to długość łańcucha z bazy danych w resztach (amnokwasach). Każda dowolna sygnatura strukturalna s określona est przez następuące parametry: r s C, S, r, (5) r gdze: C to wektor pomędzy atomam węgla C -1 oraz -tego amnokwasu w łańcuchu bałka, S to rodza struktury drugorzędowe, aką współtworzy dana reszta amnokwasowa, a r to typ amnokwasu. 3.2. Ogólny przebeg dzałana algorytmu Algorytm dopasowana został podzelony na dwe fazy (rys. 2): 1. W perwsze faze prowadzone est zgrubne dopasowane struktur przestrzennych, reprezentowanych przez elementy struktury drugorzędowe. Jest to faza dopasowana nske rozdzelczośc (ang. low resoluton algnment), poneważ grupy amnokwasów występuące w każde strukturze są w ne zgrupowane do ednego elementu reprezentatywnego. Faza ta pozwala na prowadzene szybkch dopasowań, w których budowane są macerze podobeństwa o newelkch rozmarach. Elmnue to koneczność prowadzena kosztownych dopasowań dla bałek zupełne do sebe nepodobnych. Bałka, które wykazuą podobeństwo struktur drugorzędowych, zostaą poddane bardze wnklwe analze w faze 2. 2. W druge faze prowadzone est szczegółowe dopasowane struktur przestrzennych, reprezentowanych przez tzw. sygnatury strukturalne. opasowane to opera sę na wyn-

530 A. Krygowsk, B. Małysak-Mrozek,. Mrozek kach dopasowana zgrubnego z fazy 1, est to natomast faza dopasowana wysoke rozdzelczośc (ang. hgh resoluton algnment), poneważ amnokwasy ne są w ne grupowane. Zamast tego każdy amnokwas występuący w strukturze est reprezentowany przez odpowedną sygnaturę strukturalną. Następue zatem dopasowane łańcuchów sygnatur z wykorzystanem znaczne wększych macerzy podobeństwa, nż to mało mesce w przypadku fazy 1. Ponadto w te faze est analzowanych węce cech opsuących struktury bałka, a samo bałko est reprezentowane bardze szczegółowo. Faza 1 Faza 2 Rys. 2. Ogólny przebeg dwufazowego algorytmu dopasowana Fg. 2. Overvew of two-phase algnment algorthm W obu fazach dopasowane prowadzone est z użycem, specalne zaadaptowane do tego celu, metody Smtha-Watermana [14]. Przedstawony sposób dopasowana stanow podstawę dzałana algorytmu poszukwana podobeństwa strukturalnego CASRT. Nazwa algorytmu est akronmem od słów określaących cechy reprezentatywne struktur bałkowych, wzętych pod uwagę w procese porównana C Atom, Secondary Structure Element, Resdue Type (CASRT). okładny sposób reprezentac struktur oraz przebeg obu faz dopasowana przedstawono w kolenych podrozdzałach. 3.3. Perwszy etap porównane struktur drugorzędowych W perwszym etape dzałana algorytmu struktury bałek są porównywane przez dopasowane na podstawe ch zredukowanych łańcuchów struktur drugorzędowych, zbudowanych z elementów struktur drugorzędowych. Tę fazę algorytmu nazwano także dopasowanem nske rozdzelczośc (ang. low resoluton algnment). Każdy element, czyl fragment łańcucha wyodrębnony na podstawe ego struktury drugorzędowe, charakteryzuą dwe wartośc: S, L ], (6) [

wufazowy algorytm dopasowana w poszukwanu podobeństwa 531 gdze: S określa rodza struktury drugorzędowe, a L to długość -tego elementu merzona w resztach (amnokwasach). W prezentowane metodze wyróżna sę trzy podstawowe rodzae struktur drugorzędowych: -helsa, -harmonka lub -nć, struktura neokreślona, która reprezentue równeż tzw. pętle zakręty. W celu dopasowana struktur zastosowano algorytm optymalnego dopasowana Smtha-Watermana. W przebegu algorytmu budowana est macerz podobeństwa S o wymarach n m, gdze n m określaą lczbę struktur drugorzędowych w łańcuchach, czyl lczbę fragmentów łańcuchów o rozpoznane strukturze drugorzędowe. Kolene komórk macerzy S są wypełnane zgodne z następuącym regułam: dla 0 n oraz 0 m : S S 0, (7) S, 0 0, S 1, 1, (8) (1), S S max { Sk, }, (2), 1k n k max { S, }, (3), 1l m l l (9) (10) (4) S 0, (11), ( v) S max{ S }, (12), v1..4, gdze: est nagrodą za podobeństwo, określaącą stopeń podobeństwa dwóch elementów bałek, wprowadzene przerwy o długośc k l., to ewentualne (odpowedno pozoma ponowa) kary za k l Nagroda przymue wartośc z przedzału <0;1>, gdze 0 oznacza brak podobeństwa, natomast 1 oznacza nawyższe możlwe podobeństwo. Stopeń podobeństwa wylczany est na podstawe wzoru: gdze: L L *, (13) L L L, L to długośc porównywanych fragmentów łańcuchów, natomast określa stopeń podobeństwa struktur drugorzędowych, buduących fragmenty oraz porównywanych łańcuchów. Parametr ten może przymować trzy możlwe wartośc zgodne z ponższym regułam:

532 A. Krygowsk, B. Małysak-Mrozek,. Mrozek 1) 1, gdy oba elementy maą tę samą strukturę drugorzędową, czyl oba łańcuchy maą budowę -helsy lub -harmonk; 2) 0, 5, gdy przynamne eden z łańcuchów ma neokreśloną strukturę drugorzędową; 3) 0, gdy eden z łańcuchów ma budowę -helsy, a drug -harmonk. Na przykład, eżel oba fragmenty łańcuchów maą tę samą długość, np. 8, tę samą określoną strukturę drugorzędową, to zgodne z zależnoścą (13) stopeń ch podobeństwa to: = 1 1*( 8-8 /(8+8)) = 1 1*(0/8) = 1 0 = 1. Gdyby ednak eden z łańcuchów mał długość 4, a drug długość 8, przy założenu że wcąż maą tę samą strukturę drugorzędową, to ch stopeń podobeństwa byłby następuący: = 1 1*( 4-8 /(4+8)) = 1 1*(4/12) = 2/3. Zmodyfkowany algorytm Smtha-Watermana określa na podstawe wartośc nnych komórek czy stopeń podobeństwa est wystarczaący, czy ednak bardze optymalne będze umeszczene w tym mescu przerwy w dopasowanu. 3.4. Etap drug dopasowane sygnatur strukturalnych opasowane sygnatur strukturalnych przebega analogczne do perwszego etapu, ednak wykonywane est na podstawe elementów struktur drugorzędowych, dopasowanych na etape perwszym. la każde dopasowane pary regonów tworzona est nowa macerz podobeństwa o rozmarach L z poprzednego etapu L (lub zblżonych) wykonywane est dopasowane sygnatur strukturalnych, odpowadaących regonom (dopasowane wyższe rozdzelczośc, ang. hgh resoluton algnment). Samo dopasowane przebega w sposób analogczny do perwszego etapu, różnca polega ednak na sposobe oceny podobeństwa dwóch porównywanych elementów, czyl w tym wypadku dwóch sygnatur strukturalnych s s. Przy ocene podobeństwa sygnatur uwzględna sę struktury perwszo-, drugo- trzecorzędowe, zgodne ze wzorem: gdze: C S r ss wc * ws * wr *, (14) C est podobeństwem wektorów C C opsuących położene reszt amnokwasowych w łańcuchach, S to podobeństwo struktur drugorzędowych (wylczane r zgodne z regułam 1-3, ak w perwszym etape), to podobeństwo reszt amnokwasowych, określane za pomocą zuntaryzowane macerzy substytuc BLOSUM62, w, w, w [0; C S 1] to wag dla poszczególnych składowych (domyślne wszystke przymuą wartość 1). r

wufazowy algorytm dopasowana w poszukwanu podobeństwa 533 gdze Podobeństwo wektorów C C określamy zgodne z zależnoścą: C 1 d, (15) d to moduł z różncy pomędzy długoścam wektorów C C : d C C. (16) Wartość podobeństwa sygnatur strukturalnych ss (zależność (14)) est uwzględnana ako nagroda za podobeństwo (parametr, zależność (8)). Na początku nneszego rozdzału wspomnano, że macerz podobeństwa ma przyblżone rozmary L L. okładny rozmar macerzy podobeństwa sygnatur zależy od dopasowana regonów sąsaduących z aktualne porównywanym, poneważ wszystke ewentualne reszty amnokwasowe, które ne zostały dopasowane w poprzednm kroku (czyl na lewo od porównywanych w beżącym kroku), zostaą dołączone do aktualnych regonów. Jeśl na przykład klka regonów poprzedza przerwa w ednym z łańcuchów, to wszystke reszty wchodzące do przerwy, znaduące sę we fragmence drugego łańcucha, są dołączone do regonu, sąsaduącego z nm z prawe strony. Zasadę tę zlustrowano na rysunku 3. Opsu dokonano na pozome reszt amnokwasowych ze względu łatwość wzualzac, w rzeczywstośc ednak dopasowanu ulegaą całe sygnatury strukturalne. Na rysunku 3 różnym odcenam szarośc oznaczono osobne regony łańcuchów A B (regony,, k). opasowane obemue fragmenty oznaczone czerwonym lnam (lne bezpośredno nad pod elementam sekwenc). Fragment łańcucha A składa sę z 9 reszt, natomast fragment łańcucha B składa sę z 8 reszt. Jednak poneważ po lewe strone od -tego dopasowana w łańcuchu B znadue sę przerwa, węc wszystke amnokwasy z łańcucha A, przyporządkowane do te przerwy (z częśc ), zostaną włączone do -tego dopasowana. Rys. 3. Rozszerzane regonu dopasowana o dodatkowe elementy Fg. 3. Extendng algnment regon wth addtonal elements W konsekwenc takego scalena z fragmentem łańcucha B o długośc 8 reszt (oznaczonym kolorem czerwonym) porównywany będze regon łańcucha A o długośc 17 reszt (oznaczony kolorem zelonym długa lna tuż pod ndeksam regonów oraz ). Załóżmy równeż, że po wykonanu -tego dopasowana na pozome reszt byłyby one ułożone tak ak na rysunku 3. Wówczas we fragmence łańcucha A po prawe strone pozosta-

534 A. Krygowsk, B. Małysak-Mrozek,. Mrozek łaby edna reszta (dokładne I) nedopasowana do żadne reszty z łańcucha B. W take sytuac zostałaby ona dołączona do k-tego regonu łańcucha A przy wykonywanu k-tego dopasowana. 3.5. Ocena podobeństwa struktur bałkowych Zauważmy także, że zależność (14), opsuąca stopeń podobeństwa sygnatur strukturalnych, uwzględna każdy z pozomów organzacynych struktury bałka struktury perwszo-, drugo- trzecorzędowe. Ma to duży wpływ na ocenę porównana pary sygnatur z dwóch struktur. Jeżel dwa amnokwasy opsane przez sygnatury ednocześne wykazuą duże podobeństwo reszty amnokwasowe (np. dentyczność), zgodność struktury drugorzędowe oraz zgodność struktury przestrzenne, to stnee duże prawdopodobeństwo, że oba elementy są strukturalne podobne, co znadue odzwercedlene w wysokm stopnu podobeństwa sygnatur strukturalnych. Algorytm ednocześne zakłada, że duży stopeń podobeństwa można osągnąć, eśl elementy struktury ne wykazuą podobeństwa sekwencynego (struktury perwszorzędowe). Co prawda, wartość podobeństwa sygnatur wówczas spada, ale wcąż może pozostać na wysokm pozome, eśl pozostałe składowe wcąż wykazuą podobeństwo. Oznacza to, że algorytm określa ako podobne równeż struktury, które ne wykazuą podobeństwa sekwencynego, wykazuą natomast podobeństwo kształtu. Znadue to swoe uzasadnene bologczne, struktury drugorzędowe są bowem bardze konserwatywne od struktur perwszorzędowych. Jednak, nska zgodność na pozome struktur trzecorzędowych może zostać pomnęta, eśl stnee duże podobeństwo struktur drugorzędowych perwszorzędowych, które dae duże szanse na podobeństwo ogólne struktury. użo zależy od podobeństwa ne tylko poedynczych reszt opsanych przez sygnatury strukturalne, lecz także od tego, czy zostae zachowana tendenca podobeństwa lub ego braku w otoczenu klku kolenych elementów porównywanych bałek. Tendenca ta znadue odzwercedlene w skumulowanych wartoścach komórek w macerzy podobeństwa Smtha-Watermana. Wartość mary podobeństwa Score est otrzymywana dla optymalne śceżk dopasowana w macerzy podobeństwa (oznaczone w te faze algorytmu ako S); kumulue ona wszystke możlwe nagrody za dopasowana, kary za nedopasowana oraz kary za przerwy w dopasowanu dla optymalne śceżk (zgodne z zależnoścam (7)-(12)) est równa nawyższe wartośc w macerzy S: gdze danych. Score max{ S }, (17) 1,..., q, 1,..., d, q to długość bałka kwerendowego, a d to długość bałka z bazy

wufazowy algorytm dopasowana w poszukwanu podobeństwa 535 Udzał każde składowe w procese poszukwana podobeństwa można regulować za pomocą wag udzału ustawanych przez użytkownka. Na przykład naukowcy poszukuący wyłączne zaskakuących podobeństw strukturalnych wśród bałek newykazuących podobeństwa sekwenc mogą wyłączyć składową struktury perwszorzędowe przez określene wartośc 0 dla te właśne składowe. 4. Porównane wynków dzałana algorytmu CASRT z rozwązanam konkurencynym Skuteczność dzałana algorytmu CASRT poddano różnym testom. W perwsze kolenośc porównano ten algorytm z popularne wykorzystywanym algorytmam poszukwana podobeństwa strukturalnego bałek ALI oraz VAST. W druge częśc testów porównano dopasowana generowane przez algorytm CASRT algorytm ALI. Trzeca część testów pośwęcona była badanu szybkośc dzałana algorytmu CASRT, ednakże ze względu na e obętość ne będze ona prezentowana w nneszym artykule. 4.1. Porównane zborów wynkowych W perwszym teśce porównane zostały zbory nabardze podobnych łańcuchów wskazanych przez algorytmy CASRT, ALI VAST. Utworzono 6 zapytań dla sześcu różnych bałek kwerendowych. Każde zapytane wykonano za pomocą każdego z trzech algorytmów. Bałka kwerendowe zadane w zapytanu różnły sę welkoścą (długoścą) od bałek o krótkch łańcuchach (do 100 amnokwasów), poprzez średne welkośc (do 500 amnokwasów), aż po długe łańcuchy (powyże 500 amnokwasów). W ten sposób otrzymywano trzy zbory wynkowe, z których każdy zawerał 100 struktur bałkowych (lub ch łańcuchów) wskazanych przez każdy z algorytmów ako nabardze podobne. Otrzymane zbory można podzelć na trzy grupy w zależnośc od rozmarów bałka kwerendowego. W tabelach 1-3 przedstawono zestawene opsuące, le procent tych samych bałek (łańcuchów) znalezono w zborach wynkowych testowanych algorytmów. Analzuąc wskazane zestawena, można zauważyć duże podobeństwo pomędzy wynkam generowanym przez algorytm ALI autorsk algorytm CASRT. Można także stwerdzć, że występuą dość duże rozbeżnośc pomędzy wynkam tych dwóch algorytmów a wynkam generowanym przez algorytm VAST. Jednak Powodów należy szukać ne w zasadach dzałana algorytmów, ale w wykorzystywanych bazach danych. Testowane algorytmów ALI VAST odbyło sę przez dedykowane serwsy nternetowe, które wykorzystuą swoe własne bazy danych struktur. Baza danych wykorzystywana przez algorytm CASRT est uproszczoną wersą bazy danych używane przez al-

536 A. Krygowsk, B. Małysak-Mrozek,. Mrozek gorytm ALI baza ta zawera mneszą lczbę rekordów oraz mne dokładne opsue struktury przestrzenne bałek. Algorytm VAST wykorzystue do oblczeń bazę danych MMB [15], dlatego wśród wynków poawaą sę take bałka, które ne maą swych odpowednków w baze danych stosowane podczas testowana algorytmu CASRT. Nestety autorzy ne mel zbyt dużego wpływu na bazy danych używane przez konkurencyne algorytmy właśne ze względu na fakt, ż ch testowane odbywa sę za pośrednctwem dedykowanych serwsów nternetowych, które unemożlwaą wybrane bazy danych. Nemne ednak poawane sę wspólnych bałek w każdym zborze należy uznać za dobrą prognozę przed kolenym testam. Tabela 1 Procent tych samych łańcuchów w wynkach dzałana testowanych algorytmów dla krótkch łańcuchów kwerendowych % VAST ALI CASRT VAST 100 32.5 29 ALI 32,5 100 86 CASRT 29 86 100 Tabela 2 Procent tych samych łańcuchów w wynkach dzałana testowanych algorytmów dla średnch łańcuchów kwerendowych % VAST ALI CASRT VAST 100 35 25 ALI 35 100 77 CASRT 25 77 100 Tabela 3 Procent tych samych łańcuchów w wynkach dzałana testowanych algorytmów dla długch łańcuchów kwerendowych % VAST ALI CASRT VAST 100 15 17 ALI 15 100 54 CASRT 17 54 100 Inną zauważalną prawdłowoścą est spadek podobeństwa zborów wynków dla rosnących rozmarów bałka określonego w zapytanu. Wynka to z faktu, ż m łańcuchy bałkowe zadane w zapytanu są dłuższe, tym węce możlwośc dopasowana, dlatego różnce w dopasowanach poszczególnych algorytmów są wększe. 4.2. Porównane dopasowań Poszukwane podobeństwa strukturalnego polega ne tylko na wskazywanu podobnych łańcuchów bałkowych, ale także na określenu ch dopasowana, tzn. na wskazanu wystę-

wufazowy algorytm dopasowana w poszukwanu podobeństwa 537 powana wzaemne relac (podobeństwa strukturalnego) pomędzy poszczególnym amnokwasam w strukturze porównywanych bałek. Przeprowadzone testy, podobne ak w poprzednm przypadku, pokazały dużą zbeżność wynków generowanych przez algorytmy CASRT oraz ALI, natomast mneszą zbeżność wynków w porównanu z algorytmem VAST. Wynk te mogą sę równeż neco różnć. Przyrzymy sę przykładom dopasowań strukturalnych przeprowadzonych za pomocą algorytmu CASRT (rysunek 4) oraz algorytmu ALI (rys. 5) dla pary przykładowych struktur 1K-łańcuch A [16] oraz 1CE9-łańcuch B [17] z bazy ALI. Rys. 4. opasowane strukturalne wygenerowane przez algorytm CASRT Fg. 4. Structural algnment generated by CASRT algorthm Rys. 5. opasowane strukturalne wygenerowane przez algorytm ALI Fg. 5. Structural algnment generated by ALI algorthm W strukturze drugorzędowe obu bałek występuą -helsy. opasowana wygenerowane przez oba algorytmy są neco nne w dopasowanu strukturalnym algorytmem ALI wdać zbeżność tylko edne reszty amnokwasowe (oznaczona ponową lną), natomast w dopasowanu strukturalnym algorytmem CASRT zbeżność strukturalna reszt amnokwasowych est znaczne wększa (pozyce oznaczone kolorem czerwonym lub lterą S w ln podobeństwa). Poneważ ednocześne ze zbeżnoścą strukturalną, oznaczoną przez algorytm CASRT kolorem czerwonym (lub lterą S), obserwuemy równeż zbeżność rodzaową amnokwasów, pozwala to sądzć, że na tych pozycach dopasowana strukturalne są poprawne. Podobeństwo lub wręcz dentyczność amnokwasów w porównywanych łańcuchach, szczególne tych obserwowanych na welu następuących po sobe elementach, bardzo często pocąga za sobą podobeństwo ukształtowana przestrzennego cząsteczek bałkowych. Wynka z tego, że uwzględnene w dopasowanu strukturalnym równeż podobeństwa sekwenc korzystne wpływa na końcowy wynk dopasowana.

538 A. Krygowsk, B. Małysak-Mrozek,. Mrozek Porównuąc oba rezultaty, można równeż zauważyć, że dopasowana wygenerowane przez oba algorytmy są przesunęte o trzy reszty amnokwasowe, czyl mne węce o tyle, le wynos eden obrót w -helse (na eden obrót przypada dokładne 3,6 reszty amnokwasowe). Algorytmy, które ne uwzględnaą w swom dzałanu podobeństwa sekwenc amnokwasów, są narażone na tego typu przesunęca, poneważ spralna -helsa zawera powtarzaące sę kształty, które można dopasować na różne sposoby. 5. Podsumowane Algorytm CASRT z zamplementowaną metodą dwufazowego dopasowana struktur bałkowych dae bardzo obecuące wynk. Jak pokazały przeprowadzone testy, zbór rezultatów zwracanych przez algorytm CASRT est bardzo zblżony do tego, który est zwracany przez algorytm ALI. Trudno porównać wynk algorytmu CASRT z wynkam algorytmu VAST ze względu na różne zbory bałek, które są przeszukwane w trakce prowadzonych testów. zee sę tak dlatego, że przeszukwane algorytmem VAST było prowadzone przez wtrynę nternetową, gdze użytkownk ne ma wpływu na bazę danych, na które prowadz sę poszukwana. Otrzymane wynk porównana CASRT-VAST ne są zatem nabardze warygodne, co w tym wypadku autorzy traktuą mmo wszystko ako pozytywną przesłankę, tzn. pokładaą głęboką nadzeę, że lczba zgodnych struktur byłaby procentowo wyższa w porównanu wynków obu algorytmów, gdyby badana zostały przeprowadzone na te same baze danych struktur. Z tego też powodu w dalsze częśc badań postanowono prowadzć porównana algorytmu CASRT tylko z algorytmem ALI. opasowana generowane przez oba algorytmy są podobne, przy czym w trakce prowadzonych badań autorzy znaleźl przypadk, w których algorytm CASRT dae lepsze dopasowana nż algorytm ALI. Wśród potencalnych zastosowań algorytmu CASRT można wskazać przede wszystkm dentyfkacę bałek na podstawe ch struktury przestrzenne, a w konsekwenc także przewdywane pełnonych przez bałko funkc komórkowych. Innym obszarem zastosowań może być porównywane struktur bałkowych, otrzymanych w procese predykc, do znanych struktur bałek z bazy danych oszacowane akośc predykc. alsze prace autorów będą zmerzały w kerunku poprawy wydanośc dzałana algorytmu CASRT przez efektywne składowane cech reprezentatywnych struktur bałkowych w baze danych oraz rozpraszane oblczeń na welu komputerach lub procesorach.

wufazowy algorytm dopasowana w poszukwanu podobeństwa 539 Praca naukowa fnansowana ze środków na naukę w latach 2008-2011 ako proekt badawczy N N516 265835: Poszukwane podobeństwa strukturalnego bałek w rozproszonym środowsku weloagentowym. BIBLIOGRAFIA 1. Gu J., Bourne P. E.: Structural Bonformatcs (Methods of Bochemcal Analyss), 2 edton. Wley-Blackwell, 2009. 2. Brrane G., Varma A. K., Son A., Ladas J. A.: Crystal structure of the BAR1 BRCT domans. Bochemstry, Vol. 46(26), 2007, s. 7706 7712. 3. Berman H. M., Westbrook J., Feng Z., Gllland G., Bhat T. N., Wessg H. et al.: The Proten ata Bank. Nuclec Acds Res., No. 28, 2000, s. 235 242. 4. Gbrat J. F., Made T., Bryant S. H.: Surprsng smlartes n structure comparson. Curr. Opn. Struct. Bol., Vol. 6(3), 1996, s. 377 385. 5. Holm L, Sander C.: Proten structure comparson by algnment of dstance matrces. J. Mol. Bol., Vol. 233(1), 1993, s. 123 138. 6. Shapro J., Brutlag.: FoldMner and LOCK2: proten structure comparson and motf dscovery on the web. Nuclec Acds Res., Vol. 32, 2004, s. 536 541. 7. Ye Y., Godzk A.: Flexble structure algnment by channg algned fragment pars allowng twsts. Bonformatcs, Vol. 19(2), 2003, s. 246 255. 8. Can T., Wang Y. F.: CTSS: A Robust and Effcent Method for Proten Structure Algnment Based on Local Geometrcal and Bologcal Features. Proceedngs of the 2003 IEEE Bonformatcs Conference, 2003, s. 169 179. 9. Shndyalov I. N., Bourne P. E.: Proten structure algnment by ncremental combnatoral extenson (CE) of the optmal path. Proten Engneerng, Vol. 11(9), 1998, s. 739 747. 10. Mrozek., Małysak B., Kozelsk S.: EAST: Energy Algnment Search Tool. Sprnger-Verlag GmbH, LNAI, Vol. 4223, 2006, s. 696 705. 11. Mrozek., Małysak B.: Searchng for Strong Structural Proten Smlartes wth EAST. Journal of Computer Asssted Mechancs and Engneerng Scences, No. 14, 2007, s. 681 693. 12. Mrozek., Małysak-Mrozek B.; Kozelsk S.: Algnment of proten structure energy patterns represented as sequences of Fuzzy Numbers. 32 th Annual Meetng of the North Amercan Fuzzy Informaton Processng Socety, 2009. IEEE, Cncnnat, USA 2009, s. 1 6.

540 A. Krygowsk, B. Małysak-Mrozek,. Mrozek 13. Mrozek., Małysak-Mrozek B.: An Improved Method for Proten Smlarty Searchng by Algnment of Fuzzy Energy Sgnatures. Internatonal Journal of Computatonal Intellgence Systems, Vol. 4, No. 1, Atlants Press 2011, s. 75 88. 14. Smth T. F., Waterman M. S.: Identfcaton of common molecular subsequences. J. Mol. Bol., Vol. 147, 1981, s. 195 197. 15. Hogue C., Ohkawa H., Bryant S.: A dynamc look at structures: WWW-Entrez and the Molecular Modellng atabase. Trends Bochem. Sc., Vol. 21, 1996, 226 229. 16. Keatng A. E., Malashkevch V. N., Tdor B., Km P. S.: Sde-chan repackng calculatons for predctng structures and stabltes of heterodmerc coled cols. Proc. Natl. Acad. Sc., Vol. 98(26), USA 2001, s.14825 14830. 17. Lu M., Shu W., J H., Spek E., Wang L., Kallenbach N.R.: Helx cappng n the GCN4 leucne zpper. J. Mol. Bol., Vol. 288(4), 1999, s. 743 752. Wpłynęło do Redakc 16 styczna 2012 r. Abstract Proten structure smlarty searchng s one of the key, but most dffcult tasks of modern structural bonformatcs. Whle searchng for proten sequence smlarty (smlarty at the level of prmary structure) s often carred out by usng operatons on strngs, proten structure comparson s more problematc due to the complcated nature of protens on a molecular level. If we assume that an average sze proten s made up of several hundred amno acds, and each amno acd s made up of several atoms, then a comparson of only one par of proten structures s a challenge. If you also want to compare the structure of the proten wth the entre database of protens, for example, to compare mutant structures to each other, then takng nto account the ncreasng number of proten structures n databases, such as the Proten ata Bank (PB), ths task becomes even more complcated. However, proten structure smlarty searchng s a very mportant task for the modern structural bonformatcs. Based on the nformaton about smlar proten structures we can conclude about common descent of organsms and thus, we can study the evoluton of organsms over mllons of years. The analyss of proten structures by ther comparson allows us to search for substtutes for bologcal molecules crtcal for certan cellular processes, whose lack or nadequate desgn can cause dysfuncton of the body or serous dseases.

wufazowy algorytm dopasowana w poszukwanu podobeństwa 541 In ths paper we present a new, two-phase algorthm for matchng proten structures used n the proten smlarty searchng. Presented algorthm s stll n the testng phase, but t already gves promsng results. In the paper, we also present tests that we have performed n order to examne the effectveness of the algorthm. Adresy Adam KRYGOWSKI: absolwent Instytutu Informatyk, Poltechnk Śląske, ul. Akademcka 16, 44-100 Glwce, Polska, adam.krygowsk@gmal.com. Bożena MAŁYSIAK-MROZEK: Poltechnka Śląska, Instytut Informatyk, ul. Akademcka 16, 44-100 Glwce, Polska, bozena.malysak@polsl.pl. arusz MROZEK: Poltechnka Śląska, Instytut Informatyk, ul. Akademcka 16, 44-100 Glwce, Polska, darusz.mrozek@polsl.pl.