Wykrywanie horyzontalnego transferu genów

Podobne dokumenty
Paradygmaty dowodzenia

Schematy Piramid Logicznych

(4) x (y z) = (x y) (x z), x (y z) = (x y) (x z), (3) x (x y) = x, x (x y) = x, (2) x 0 = x, x 1 = x

Struktury danych i złożoność obliczeniowa Wykład 5. Prof. dr hab. inż. Jan Magott

Informacja o przestrzeniach Sobolewa

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

Modele i narzędzia optymalizacji w systemach informatycznych zarządzania

A i. i=1. i=1. i=1. i=1. W dalszej części skryptu będziemy mieli najczęściej do czynienia z miarami określonymi na rodzinach, które są σ - algebrami.

Za pierwszy niebanalny algorytm uważa się algorytm Euklidesa wyszukiwanie NWD dwóch liczb (400 a 300 rok przed narodzeniem Chrystusa).

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Poprawność semantyczna

Liczby zespolone. x + 2 = 0.

TEORETYCZNE PODSTAWY INFORMATYKI

Modelowanie motywów łańcuchami Markowa wyższego rzędu

Algorytmy genetyczne

Dystrybucje, wiadomości wstępne (I)

Wykład 4. Określimy teraz pewną ważną klasę pierścieni.

Algorytm Grovera. Kwantowe przeszukiwanie zbiorów. Robert Nowotniak

Metoda tabel semantycznych. Dedukcja drogi Watsonie, dedukcja... Definicja logicznej konsekwencji. Logika obliczeniowa.

9. Schematy aproksymacyjne

1. Synteza automatów Moore a i Mealy realizujących zadane przekształcenie 2. Transformacja automatu Moore a w automat Mealy i odwrotnie

Programowanie liniowe

Transformacja wiedzy w budowie i eksploatacji maszyn

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Filogeneza: problem konstrukcji grafu (drzewa) zależności pomiędzy gatunkami.

UNIKANIE IMPASÓW W SYSTEMACH PROCESÓW WSPÓŁBIEŻNYCH

Drzewa spinające MST dla grafów ważonych Maksymalne drzewo spinające Drzewo Steinera. Wykład 6. Drzewa cz. II

Acknowledgement. Drzewa filogenetyczne

Postać Jordana macierzy

Autoreferat. Uzgadnianie drzew: teoria i zastosowania

Tworzenie gier na urządzenia mobilne

Algorytmika Problemów Trudnych

Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych

Algorytmy Równoległe i Rozproszone Część X - Algorytmy samostabilizujące.

Logika Stosowana. Wykład 2 - Logika modalna Część 2. Marcin Szczuka. Instytut Informatyki UW. Wykład monograficzny, semestr letni 2016/2017

Schemat programowania dynamicznego (ang. dynamic programming)

Programowanie celowe #1

Elementy logiki. Algebra Boole a. Analiza i synteza układów logicznych

9.9 Algorytmy przeglądu

Zad. 1 Zad. 2 Zad. 3 Zad. 4 Zad. 5 SUMA

3. Macierze i Układy Równań Liniowych

FUNKCJE. (odwzorowania) Funkcje 1

Jak trudne jest numeryczne całkowanie (O złożoności zadań ciągłych)

Elementy inteligencji obliczeniowej

Korzystając z własności metryki łatwo wykazać, że dla dowolnych x, y, z X zachodzi

Matematyka bankowa 1 1 wykład

komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW

Treść wykładu. Pierścienie wielomianów. Dzielenie wielomianów i algorytm Euklidesa Pierścienie ilorazowe wielomianów

Problemy z ograniczeniami

Krzywa uniwersalna Sierpińskiego

Spacery losowe generowanie realizacji procesu losowego

Ciała i wielomiany 1. przez 1, i nazywamy jedynką, zaś element odwrotny do a 0 względem działania oznaczamy przez a 1, i nazywamy odwrotnością a);

Prawa wielkich liczb, centralne twierdzenia graniczne

Algorytm simplex i dualność

Technologie baz danych

Drzewa decyzyjne. Inteligentne Obliczenia. Wydział Mechatroniki Politechniki Warszawskiej. Anna Sztyber

Modele optymalizacyjne wspomagania decyzji wytwórców na rynku energii elektrycznej

Kolorowanie wierzchołków Kolorowanie krawędzi Kolorowanie regionów i map. Wykład 8. Kolorowanie

SCENARIUSZ LEKCJI. Streszczenie. Czas realizacji. Podstawa programowa

Algebrą nazywamy strukturę A = (A, {F i : i I }), gdzie A jest zbiorem zwanym uniwersum algebry, zaś F i : A F i

Wokół Problemu Steinhausa z teorii liczb

ZAGADNIENIE TRANSPORTOWE

Logika Stosowana. Wykład 1 - Logika zdaniowa. Marcin Szczuka. Instytut Informatyki UW. Wykład monograficzny, semestr letni 2016/2017

Wstęp do Sztucznej Inteligencji

ANALIZA WSPÓŁCZYNNIKA STRATY AL- GORYTMÓW PAKOWANIA FIRST FIT ORAZ BEST FIT PRZY ŁADUNKACH O ROZKŁA- DZIE GAUSSA

Konstrukcja odcinków niewymiernych z wykorzystaniem. Twierdzenia Pitagorasa.

Wykład 8. Informatyka Stosowana. 26 listopada 2018 Magdalena Alama-Bućko. Informatyka Stosowana Wykład , M.A-B 1 / 31

8 Całka stochastyczna względem semimartyngałów

Dlaczego nie wystarczają liczby wymierne

O LICZBACH NIEOBLICZALNYCH I ICH ZWIĄZKACH Z INFORMATYKĄ

Podstawy Informatyki. Metody dostępu do danych

PRZEDMIOTOWY SYSTEM OCENIANIA - MATEMATYKA

Teoria grafów dla małolatów. Andrzej Przemysław Urbański Instytut Informatyki Politechnika Poznańska

Heurystyki. Strategie poszukiwań

Transformata Fouriera. Sylwia Kołoda Magdalena Pacek Krzysztof Kolago

Zad. 3: Układ równań liniowych

Algorytm. Krótka historia algorytmów

3. Wykład 3: Dowody indukcyjne, strategie dowodowe Dowody indukcyjne. Dotychczas zobaczyliśmy w jaki sposób można specyfikować definicje

Rozkład materiału nauczania

Struktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott

Algebra Boole a i jej zastosowania

Zależności funkcyjne

Efektywność algorytmów

Funkcje wymierne. Funkcja homograficzna. Równania i nierówności wymierne.

Zasada indukcji matematycznej

Algorytmy heurystyczne w UCB dla DVRP

Logika Matematyczna (10)

W naukach technicznych większość rozpatrywanych wielkości możemy zapisać w jednej z trzech postaci: skalara, wektora oraz tensora.

10. Wstęp do Teorii Gier

Kolorowanie wierzchołków grafu

Wykład 8. Drzewo rozpinające (minimum spanning tree)

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Metoda Tablic Semantycznych

Skalowalność obliczeń równoległych. Krzysztof Banaś Obliczenia Wysokiej Wydajności 1

Ciagi liczbowe wykład 4

Matematyka dyskretna. Andrzej Łachwa, UJ, /10

Kumulowanie się defektów jest możliwe - analiza i potwierdzenie tezy

domykanie relacji, relacja równoważności, rozkłady zbiorów

Matematyka dyskretna. 1. Relacje

Transkrypt:

Streszczenie rozprawy doktorskiej pod tytułem Wykrywanie horyzontalnego transferu genów Paweł Górecki 1 Wprowadzenie Tematem niniejszej rozprawy są zagadnienia z pogranicza biologii molekularnej, matematyki i informatyki dotyczące własności modeli ewolucyjnych uwzględniających horyzontalny transfer genów (w skrócie HGT) i praktycznych metod jego wykrywania. Współczesnie metody rekonstrukcji drzew ewolucyjnych gatunków są następujące: korzystając ze znanych sekewncji DNA lub sekwencji aminokwasów oblicz drzewa ewolucyjne dla rodzin genów (nazywane drzewami genów), a następnie znajdź drzewo ewolucyjne gatunków (nazywane drzewem gatunków) najbardziej podobne w pewnych sensie do tego zbioru drzew rodzin genów. Trudność tego zadania polega na możliwych różnicach pomiędzy drzewami genów, które wynikają z prostego faktu, że ewolucja genów zwykle przebiega inaczej niż ewolucja gatunków. Stąd mamy dwa ważne problemy: rekonstrukcja drzewa gatunków ze zbioru drzew genów, uzgodnienie danego drzewa gatunków z danym drzewem genów. W tej rozprawie zajmujemy się głównie tym drugim problemem, który można nieformalnie nazywać wbudowywaniem drzewa (genów) w drzewo (gatunków). To pozornie dziwaczne sformułowanie ma swoje uzasadnienie biologiczne: gatunki można w pewnym sensie traktować jak pojemniki dla genów, co przy uwzględnieniu zależności ewolucyjnych (wyrażanych w postaci drzew) daje wyżej wspomniane wbudowywanie drzew ewolucyjnych. Drzewo rodziny genów Drzewo gatunków + horyzontalny transfer A A A B C A B C D Rysunek 1: Jak uzgodnić te drzewa? Rozważmy przykład problemu uzgadniania przedstawiony na Rysunku 1. Liście grafów z tego rysunku są etykietowane nazwami gatunków A, B, C i D. Prawe drzewo posiadające jeden horyzontalny transfer, jest nazywane w tej pracy grafem gatunków. Ponadto mamy drzewo ewolucyjne rodziny 5 genów (lewe drzewo). Zauważmy, że etykiety liści drzewa genów są nazwami gatunków. Oznacza to, że 1

odpowiednia sekwencja genu pochodzi od gatunku o danej nazwie. Zatem, mamy tu 3 geny pochodzące od gatunku A, po jednym od B i C, natomiast gatunek D nie ma genów reprezentowanych w tej rodzinie (być może ten gatunek posiada geny w tej rodzinie ale są jeszcze nieznane). Zauważmy, że HGT na drzewie gatunków oznacza pewną hipotezę, która może być wykorzystana do odszukania pewnego scenariusza ewolucyjnego uzgadniającego te dwa drzewa. Na Rysunku 2 przedstawiamy dwa wbudowania drzewa genów w drzewo gatunków z transferem genów. Można pokazać, że E 1 jest minimalnym wbudowaniem o koszcie 1 7 (4 straty + 3 duplikacje genów) w tzw. modelu duplikacji i strat, w którym nie uwzględnia się HGT. Analogicznie, można pokazać, że E 2 jest minimalnym wbudowaniem o koszcie 3 (1 HGT + 2 duplikacje) dla modelu z transferem genów. Te dwa powyższe modele są obiektem badań tej rozprawy. Wbudowanie E 1 Wbudowanie E 2 specjacja duplikacja genu strata genu HGT linia ewol. genu A B C D A B C D Rysunek 2: Przykłady wbudowań drzewa genów w drzewo gatunków (z Rys. 1) W pierwszej części tej pracy przedstawiony jest nowy model drzew ewolucyjnych, nazywanych DLS-drzewami, w którym uwzględniane są duplikacje i straty genów (ewolucja genów) oraz specjacje (ewolucja gatunków). DLS-drzewa reprezentują ewolucję genów w kontekście ewolucji gatunków. Z DLS-drzewa można odtworzyć wbudowania (Rysunek 2). Jest to model bazowy, który w następnej części będzie uzupełniony o horyzontalny transfer genów. W tej części pokazujemy wiele ciekawych własności tego modelu. W szczególności pokazujemy związki DLS-drzew z drzewami uzgadniającymi (Page, 1994). Dzięki tym związkom rozwiązujemy niektóre otwarte problemy postawione w (Page and Charleston, 1997b) dla drzew uzgadniających. W drugiej części tej pracy przedstawiony jest nowy model drzew ewolucyjnych, nazywanych H-drzewami, w którym uwzględniane są duplikacje, straty i horyzontalny transfer genów (ewolucja genów) oraz specjacje (ewolucja gatunków). H-drzewa są rozszerzeniem DLS-drzew. Jednakże ze względu na transfer, który umożliwia dodatkowe warianty uzgadniania, ich struktura jest znacznie bardziej skomplikowana i ciekawsza. Analogicznie do DLS-drzew, H-drzewa można przekształcać w kontekście grafu gatunków do wbudowań (tak jak na Rysunku 2). W tej części pokazujemy analogiczne własności tego modelu. W szczególności pokazujemy związki H-drzew z drzewami uzgadniającymi z transferem (Górecki, 2004). 1 Koszt będący sumą duplikacji i strat jest nazywany kosztem mutacyjnym. 2

W rozdziale 4 przedstawiony jest algorytm o wielomianowej złożoności czasowej i pamięciowej, obliczający dla danego drzewa genów i grafu gatunków tzw., minimalny ważony koszt H-drzewa. W szczególności jest to algorytm pozwalający na weryfikowanie hipotez horyzontalnego transferu genów. W następnej części streszczenia przedstawiamy bardziej szczegółowo wyniki z poszczególnych rozdziałów. 2 DLS-drzewa W rozdziale 2 pracy przedstawiamy nowy model drzew ewolucyjnych oparty na koncepcjach modelu duplikacji i strat (bez transferu genów). Przedstawiamy definicję DLS-drzewa, które jest modelem ewolucji drzewa genów w kontekście drzewa gatunków przy założeniu, że dopuszczalne są tylko duplikacje i straty genów (ewolucja genów) oraz specjacje (ewolucja gatunków). DLS-drzewa pozwalają na modelowanie dowolnych scenariuszy ewolucyjnych, nie tylko tych minimalnych (por. drzewa uzgadniające (Page, 1994)). Pokazujemy jak z DLS-drzewa można otrzymać drzewo genów i drzewo gatunków. Definiujemy system przepisywania DLSdrzew zawierający 4 reguły: SPEC, DUP (typu I, usuwające proste wystąpienia strat genów) oraz CLOST, TMOVE (typu II). Ich interpretacje biologiczne przedstawione są na Rysunku 3 (kwadrat oznaczają duplikację, kółko stratę, a przerywana linia specjację). Zauważmy, że redukcja zmniejsza koszt mutacyjny i rozmiar drzewa. SPEC DUP TMOVE CLOST Rysunek 3: Interpretacje biologiczne reguł dla DLS-drzew Będziemy mówić, że dwa DLS-drzewa są równoważne jeśli jedno może być przekształcone w drugie przez zastosowanie zero lub większej liczby redukcji w dowolnym kierunku. Ten system posiada znaczące własności biologiczne i matematyczne. W szczególności przekształcanie zachowuje drzewa genów i gatunków. System posiada własność konfluencji i silnej normalizacji, w szczególności w każdej klasie równoważnych DLS-drzew istnieje jednoznaczna postać normalna (tzn. nieredukowalne DLS-drzewo), łatwo osiągalna przez redukcje w naszym systemie. Łatwo stąd wynika, że koszt mutacyjny i rozmiar drzewa w postaci normalnej jest minimalny w klasie równoważnych DLS-drzew (patrz także Twierdzenie 1). 3

Oprócz drzew w postaci normalnej, analizujemy także ogólne własności DLSdrzew. W klasie równoważnych drzew wyróżniamy ważny podzbiór drzew seminormalnych, tzn. niezawierających redeksów reguł typu I. Pokazujemy, że równoważne drzewa semi-normalne można przedstawić w skończonego postaci diagramu (DAG-u), gdzie krawędziami są redukcje typu II. Pokazujemy, że system z odwróconymi regułami typu II jest silnie normalizowanly, a jednoznaczną postacią normalną w takim systemie reguł jest drzewo tłuste, które wszystkie duplikacje ma w czubku. Zatem, każdy taki diagram drzew semi-normalnych posiada jeden korzeń (drzewo tłuste) oraz jeden liść (postać normalną). W szczególności, z naszej analizy wynika, że minimalny koszt duplikacyjny (czyli liczba duplikacji) w klasie drzew równoważnych może posiadać także drzewo nie będące w postaci normalnej. Pokazujemy jak z danego drzewa genów i danego drzewa gatunków rekonstruować drzewa w postaci normalnej. W ostatniej części tego rozdziału pokazujemy związki DLS-drzew z modelem duplikacji i strat. Ten model, zwany też modelem drzew uzgadniających, jest stosunkowo dobrze poznanym (Page, 1994; Mirkin et al., 1995; Eulenstein and Vingron, 1998; Zhang, 1997; Page and Charleston, 1997a; Eulenstein et al., 1998; Page and Charleston, 1997b; Ma et al., 1998; Bonizzoni et al., 2003; Górecki and Tiuryn, 2005). Drzewo uzgadniające, będące kluczowym pojęciem tego modelu, zdefiniowane przez Page a (1994) było traktowane jako minimalne w sensie rozmiaru, kosztu etc. Jednakże przez wiele lat nie było dowodu tych własności, które jako otwarte problemy były postawione w pracy (Page and Charleston, 1997b). Dopiero w pracy (Bonizzoni et al., 2003) autorzy rozwiązują problem dotyczący minimalizacji drzewa uzgadniającego w sensie rozmiaru. W ostatniej części rozdziału o DLS-drzewach pokazujemy, że drzewo uzgadniające można łatwo przekształcić do DLS-drzewa w postaci normalnej. W szczególności, z wyników przedstawionych w tym rozdziale rozwiązujemy problemy przedstawione w (Page and Charleston, 1997b) dla drzew uzgadniających. 3 H-drzewa W rozdziale 3 pracy przedstawiamy nowy model drzew ewolucyjncych oparty na koncepcjach modelu duplikacji, strat i horyzontalnego transferu genów (Charleston, 1998; Hallett and Lagergren, 2001; Addario-Berry et al., 2003; Górecki, 2003, 2004; Hallett et al., 2004). W pierwszej części definiujemy pojęcie grafu gatunków, które jest modelem ewolucji gatunków z horyzontalnymi transferami genów. Nieformalnie możemy napisać: graf gatunków = drzewo gatunków + horyzontalne transfery genów (patrz Rysunek 1). Jednak nie wszystkie transfery są poprawne - nie mogą one naruszać czasowych zależności, np. niedozwolone jest krzyżowanie w czasie. Analiza tych własności wykazuje, że dla każdego grafu gatunków istnieje relacja częściowego porządku na transferach nazywana relacją zależności. Analizujemy też sytuację odwrotną, tzn. gdy zbiór transferów jest określony i odpowiadamy na pytanie Kiedy możemy dodać go do drzewa gatunków tak by powstał graf gatunków?. 4

Przedstawiamy definicję H-drzewa, które jest modelem ewolucji drzewa genów w kontekście grafu gatunków przy założeniu, że dopuszczalne są tylko duplikacje, straty i horyzontalny transfer genów (ewolucja genów) oraz specjacje (ewolucja gatunków). H-drzewo jest rozszerzeniem DLS-drzewa. Ale oprócz transferów, H- drzewo posiada dodatkowo relację częściowego porządku na transferach nazywaną horyzontalną zależnością. Na Rysunku 4 pokazujemy jak przykładowa ewolucja trzech gatunków i pięciu genów pochodzących od tych gatunków jest reprezentowana w modelu H-drzew (w modelu DLS-drzew sytuacja jest analogiczna ale bez HGT). EWOLUCJA GATUNKÓW EWOLUCJA GENÓW W GATUNKACH Czas EWOLUCJA GENÓW Ewolucja SPECJACJA DUPLIKACJA GENU HGT SPECJACJA STRATA GENU Model f c d S f c d f f c cdf D cd f c d f f c c d G cd cd d c cd d f f c c d Wbudowanie f c d Rysunek 4: Przykładowa ewolucja genów i gatunków, interpretacja w modelu (graf gatunkóws, H-drzewo D, drzewo genówg) oraz wbudowanie H-drzewa, podobnie jak DLS-drzewa, pozwalają na modelowanie dowolnych scenariuszy ewolucyjnych, nie tylko minimalnych. Pokazujemy jak z H-drzewa otrzymać drzewo genów (takie drzewo genów będzie nazywane zgodnym z danym H-drzewem). Ale okazuje się, że H-drzewo może reprezentować ewolucję genów w kontekście wielu grafów gatunków (co jest zgodne z interpretacją biologiczną H- drzewa). Określamy pojęcie zgodnego grafu gatunków wykorzystując m.in. horyzontalną zależność i relację zależności. Nieformalnie można napisać, że H-drzewo jest zgodne z danym grafem gatunków jeśli istnieje interpretacja dla tego H-drzewa w postaci wbudowania w ten graf gatunków (por. Rysunki 2 i 4). Analogiczne do reguł dla DLS-drzew, definiujemy system przepisywania H- drzew zawierający 7 reguł. Oprócz reguł z Rysunku 3 dodajemy jedną regułę typu I: HGT oraz dwie reguły typu II: H-CLOST i H-TMOVE. Ich interpretacje biologiczne przedstawione są na Rysunku 5. 5

HGT H-TMOVE H-CLOST Rysunek 5: Interpretacje biologiczne dodatkowych reguł dla H-drzew Dowodzimy analogicznych własności dla H-drzew: zachowywanie przez redukcję drzewa genów oraz zbioru zgodnych grafów gatunków, konfluencja, silna normalizacja. Definiujemy drzewa tłuste, semi-normalne i analizujemy ich diagramy. Otrzymujemy analogiczne wyniki dotyczące minimalizacji kosztów w klasie równoważnych H-drzew (Wniosek 42 z Twierdzenia 41): Twierdzenie 1 Dla H-drzewa T, nieredukowalne H-drzewo otrzymane z T przez redukcje systemu jest jednoznacznym H-drzewem o najmniejszym koszcie (liczonym jako suma horyzontalnych transferów, duplikacji i strat genów) w klasie wszystkich H-drzew równoważnych T. Pokazujemy jak z danego drzewa genówgidanego grafu gatunkówsrekonstruować drzewa w postaci normalnej. W tym celu wprowadzamy pojęcie scenariusza (Górecki, 2004), który odpowiada wyborowi pewnego schematu użycia transferów z grafu gatunków. Okazuje się, że dla każdego scenariuszaξ istnieje H-drzewo Ψ ξ (efektywnie konstruowalne) w postaci normalnej zgodne zgorazs. Ponadto, pokazujemy także (patrz Twierdzenie 81): Twierdzenie 2 Niech G będzie drzewem genów, a S grafem gatunków, takim że wszystkie gatunki zgwystępują ws. Wtedy, dla każdego drzewa T zgodnego zgi S, istnieje scenariuszξ, taki że alboψ ξ = T albo T jest poddrzewemψ ξ. W ten sposób otrzymujemy pełną klasyfikację, a także sposób na otrzymywanie H-drzew w postaci normalnej zgodnych z danym drzewem genów i danym grafem gatunków. Z Twierdzenia 1 wynika, że poszukiwanie H-drzew minimalizujących koszt powinno być ograniczone do drzew w postaci normalnej. Ponadto, z Twierdzenia 2 otrzymujemy, że powinniśmy rozważać tylko te H-drzewa w postaci normalnej, które nie zawierają poddrzew w postaci normalnej zgodnych zgis. W ostatniej części tego rozdziału pokazujemy związki z drzewami uzgadniającymi (Górecki, 2004). 4 Algorytm i przykłady W rozdziale 4 przedstawiony jest algorytm o wielomianowej złożoności czasowej i pamięciowej, obliczający dla danego drzewa genów G i grafu gatunków S mini- 6

malny ważony koszt H-drzewa w zbiorze H-drzew zgodnych zgis. Ten algorytm może być łatwo rozszerzony do wersji generującej optymalne (tzn., posiadające ten minimalny ważony koszt) H-drzewo. W szczególności jest to algorytm pozwalający na weryfikowanie hipotez horyzontalnego transferu genów. Oprócz algorytmu przedstawiamy prosty biologiczny przykład i kilka sztucznych przykładów (w dodatku). 5 Podsumowanie Wyniki zawarte w tej pracy mogą być stosowane nie tylko do weryfikowania lub wykrywania hipotez HGT ale także w innych systemach posiadających cechy drzew w drzewach (w naszym przypadku mamy system typu gen-gatunek). Np. w biogeografii (system typu organizm-obszar), gdzie transfer odpowiada przemieszczeniu się organizmów na nowy obszar (Nelson and Platnick, 1981; Swenson et al., 2001; Arvestad et al., 2004), w parazytologii (system typu gospodarz-pasożyt), gdzie transfer odpowiada przemieszczeniu się pasożyta na nowy gatunek (Page, 1993, 1994). W ramach prac nad rozprawą powstał system komputerowy do obliczania i wizualizacji wyników, w którym zaimplementowano wszystkie algorytmy przedstawione w pracy. Wkrótce będzie dostępny w sieci. Literatura Addario-Berry, L., Hallett, M., and Lagergren, J., 2003. Towards identifying lateral gene transfer events. In Pacific Symposium on Biocomputing, 279 290. Arvestad, L., Berglund, A.-C., Lagergren, J., and Sennblad, B., 2004. Gene tree reconstruction and orthology analysis based on an integrated model for duplications and sequence evolution. In RECOMB 2004. Bonizzoni, P., Vedova, G., and Dondi, R., 2003. Reconciling gene trees to a species tree. Algorithms and Complexity, Proceedings of the 5th Italian Conference (CIAC 2003) 2653, 120 131. Charleston, M. A., 1998. Jungles: A new solution to the host/parasite phylogeny reconciliation problem. Mathematical Biosciences 149, 191 223. Eulenstein, O., Mirkin, B., and Vingron, M., 1998. Duplication-based measures of difference between gene and species trees. Journal of Computational Biology 5, 135 148. Eulenstein, O. and Vingron, M., 1998. On the equivalence of two tree mapping measures. DAMATH: Discrete Applied Mathematics and Combinatorial Operations Research and Computer Science 88. 7

Górecki, P., 2003. Single step reconciliation algorithm for duplication, loss and horizontal gene transfer model. In Proceedings of ECCB 2003. Paris. Górecki, P., 2004. Reconciliation problems for duplication, loss and horizontal gene transfer. In RECOMB 2004, 316 325. San Diego. Górecki, P. and Tiuryn, J., 2005. On the structure of reconciliations. LNCS 3388, 42 54. Hallett, M. and Lagergren, J., 2001. Efficient algorithms for lateral gene transfer problems. In RECOMB 2001, 149 156. ACM Press, New York. Hallett, M., Lagergren, J., and Tofigh, A., 2004. Simultaneous identification of duplications and lateral transfers. In RECOMB 2004, 316 325. San Diego. Ma, B., Li, M., and Zhang, L., 1998. On reconstructing species trees from gene trees in term of duplications and losses. In RECOMB 1998, 182 191. Mirkin, B., Muchnik, I., and Smith, T. F., 1995. A biologically consistent model for comparing molecular phylogenies. J. of Comput. Biol. 2, 493 507. Nelson, G. and Platnick, N. I., 1981. Systematics and Biogeography: Cladistics and Vicariance. Columbia University Press, New York. Page, R., 1993. Parasites, phylogeny and cospeciation. International Journal of Parasitology 23, 449 506. Page, R. D. M., 1994. Maps between trees and cladistic analysis of historical associations among genes, organisms, and areas. Systematic Biology 43, 58 77. Page, R. D. M. and Charleston, M. A., 1997a. From gene to organismal phylogeny: reconciled trees and the gene tree/species tree problem. Mol. Phylogenet. Evol. 7, 231 240. Page, R. D. M. and Charleston, M. A., 1997b. Reconciled trees and incogruent gene and species trees. Mathematical Hierarchies and Biology, DIMACS Series in Mathematics and Theoretical Computers Science 37. Swenson, U., Backlund, A., McLoughlin, S., and Hill, R. S., 2001. Nothofagus biogeography revisited with special emphasis on the enigmatic distribution of subgenus Brassosphora in New Caledonia. Cladistics 17, 28 47. Zhang, L., 1997. On a Mirkin-Muchnik-Smith conjecture for comparing molecular phylogenies. Journal of Computational Biology 4, 177 188. 8