Dane molekularne dla M. tuberculosis i możliwości ich wykorzystania do walki z opornością na leki 9 grudnia 2009
Plan prezentacji 1 Wprowadzenie Informacje ogólne Oporność na leki Mechanizmy powstawania oporności Mechanizmy oporności 2 Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe 3 Dane mikromacierzowe i sieci koekspresji Sieci regulacji genów Sieci interakcji 4 Cele i postęp Pierwszy eksperyment obliczeniowy
Gruźlica Wprowadzenie Informacje ogólne Oporność na leki Mechanizmy powstawania oporności Mechanizmy oporności Gruźlica (łac. tuberculosis) powszechna i potencjalnie śmiertelna choroba zakaźna, wywoływana przez prątka gruźlicy (Mycobacterium tuberculosis). Atakuje głównie płuca (gruźlica płucna) WHO (Światowa Organizacja Zdrowia) określiła gruźlicę jako globalne niebezpieczeństwo a Organizacja Stop gruźlicy stworzyła Globalny Plan Walki z Gruźlicą.
Mycobacterium Tuberculosis Informacje ogólne Oporność na leki Mechanizmy powstawania oporności Mechanizmy oporności Gram-dodatnia bakteria, po raz pierwszy została wyodrębniona przez niemieckiego uczonego Roberta Kocha w 1882 roku. Systematyka: Królestwo: Bakterie Typ: Actinobacteria Rząd: Actinomycetales Podrząd: Corynebacterineae Rodzina: Mycobacteriaceae Rodzaj: Mycobacterium Gatunek: Mycobacterium Tuberculosis
Statystyki WHO Wprowadzenie Informacje ogólne Oporność na leki Mechanizmy powstawania oporności Mechanizmy oporności W 2007 roku zabiła ok. 1.7 miliona osób i szacuje się, że ok 9.25 mln osób zostało zarażonych - głównie w Azji i Afryce subsaharyjskiej. Szacuje się, że wśród zmarłych 456 tys. było zainfekowanych przez HIV. Osłabienie systemu immunologicznego wielokrotnie zwiększa prawdopodobieństwo aktywacji choroby.
Rodzaje oporności na leki Informacje ogólne Oporność na leki Mechanizmy powstawania oporności Mechanizmy oporności MDR (Multi-Drug Resistance) - oporność przynajmniej na isoniazid i rifampicin. XDR (extensively-drug Resistance) - MDR, dodatkowo oporne na fluoroquinolone i przynajmniej jeden lek drugiego rzędu (amikacin, kanamycin lub capreomycin) Od lewej: isoniazid, rifampin, pyrazinamid, ethambutol.
Informacje ogólne Oporność na leki Mechanizmy powstawania oporności Mechanizmy oporności Działanie leków pierwszego rzędu na szczepy podatne
Działanie leków na MDR Informacje ogólne Oporność na leki Mechanizmy powstawania oporności Mechanizmy oporności
Działanie leków na XDR Informacje ogólne Oporność na leki Mechanizmy powstawania oporności Mechanizmy oporności
Mechanizmy powstawania oporności Informacje ogólne Oporność na leki Mechanizmy powstawania oporności Mechanizmy oporności Spontaniczne mutacje Indukowane mutacje przez SOS Horyzontalny transfer genów (HGV): np. pompy usuwające cząsteczki leku
Mechanizmy oporności Informacje ogólne Oporność na leki Mechanizmy powstawania oporności Mechanizmy oporności Inaktywacja leku lub modyfikacja (np. enzymatyczna deaktywacja Penicyliny G w pewnych bakteriach odpornych na penicylinę poprzez produkcję β -lactamases). Zmiana miejsca docelowego przyczepu leku (np. oporność gronkowców na metycylinę). Zmniejszone akumulowanie leku, poprzez zmniejszenie przepuszczania przez błonę komórkową lub zwiększoną wydajność mechanizmów wypompowujących lek. Utworzenie alternatywnych ścieżek metabolicznych.
Potencjalnie interesujące dane Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe Rodzaje potencjalnie interesujących danych Genomy szczepów M. tuberculosis Funkcje oraz opisy białek i odpowiednich genów Informacje o białkach (funkcje, struktura 3D itp.) Mutacje związane z opornymi szczepami M. tuberculosis Dane o lekach Ścieżki metaboliczne i sygnałowe Dane mikromacierzowe ekspresji genów Sieci regulacji genów Sieci interakcji białek
Sekwencjonowanie M.Tuberculosis I Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe Obecnie zsekwencjonowane szczepy M. tuberculosis: H37Rv - Szczep ten została wyizolowany z płuc człowieka w 1934 roku. Został szeroko wykorzystany na całym świecie w badaniach biomedycznych. Cechuje się wysoką złośliwością oraz podatnością na leki. Genom składa się 4.411.529 par zasad oraz 3989 genów. (Wellcome Trust Sanger Institute, UK, 1998) H37Ra - Wyizolowany od 19 letniego pacjenta z przewlekłą gruźlicą płuc w 1905 roku. Pochodzi od szczepu macierzystego H37Rv. H37Ra posiada kilka różnych cech w porównaniu ze szczepem H37Rv, takie jak: zmiana formacji kolonii, zmniejszenie zdolności do przetrwania w warunkach beztlenowych, zmniejszona zdolność do przetrwania wewnątrz makrofagów oraz zmniejszona złośliwość. (Chinese National Human Genome Center at Shanghai, China, 2007)
Sekwencjonowanie M.Tuberculosis II Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe F11 - ten szczep stanowi największą część izolatów pobranych od chorych na gruźlicę podczas epidemii gruźlicy w Afryce Południowej. Występuje także w innych częściach świata. (Broad Institute of MIT and Harvard, USA, 2007) CDC1551 - szczep wyizolowany od pracownika fabryki odzieży z Kentucky, USA. Jest wysoce zaraźliwy, zarażając około 80% pacjentów z kontaktów społecznych. Mimo to ten szczep nie spowodował epidemii u ludzi i jest wrażliwy na wiele leków. Jest bardzo złośliwy wśród myszy, tworząc kilka rzędów wielkości więcej bakterii niż szczep H37Rv. (The Institute for Genomic Research, USA, 2001) KZN 1435 - szczep z wysoce opornej rodziny KZN, został wyizolowany od chorego w KwaZulu-Natal RPA. Jest MDR. (Broad Institute of MIT and Harvard, USA, 2009) Haarlem - wyizolowany został w Haarlem w Holandii. Występowanie zostało potwierdzone w wielu miejscach na świecie. (Broad Institute of MIT and Harvard, USA, 2009)
Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe Sekwencjonowanie M. Tuberculosis III (2009) Nowe całkowicie zsekwencjonowane genomy wyizolowane odpowiednio w 1994,1995, 2006 roku od pacjentów w Durban ie: KZN V4207 (podatny na leki), KZN V2475 (MDR), KZN R506 (XDR). Oprócz tego wiele izolatów jest częściowo zsekwencjonowanych, niektóre prace porównują nawet ponad 100 genomów.
Funkcje genów Wprowadzenie Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe Re-annotation of the genome sequence of Mycobacterium tuberculosis H37Rv Jean-Christophe Camus, Melinda J. Pryor, Claudine Medigue, and Stewart T. Cole. Microbiology 2002
Funkcje genów Wprowadzenie Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe Najważniejsze wnioski z pracy: dla 2058 białek została przypisana funkcja (52% z 3995 wszystkich białek), dla 376 białek nie wykryto homologów, co może oznaczać, że są unikalne dla M. Tuberculosis funkcja ponad 150 białek została potwierdzona eksperymentalnie dane o funkcjach białek zostały zebrane w bazie danych TubercuList
Funkcje genów (J.C. Camus 2002) Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe Niewielkie różnice pomiędzy rokiem 2002 a obecnym stanem bazy.
Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe Dane o mutacjach M. Tuberculosis - praca Tuberculosis Drug Resistance Mutation Database Andreas Sandgren, Michael Strong, Preetika Muthukrishnan, Brian K. Weiner, George M. Church, Megan B. Murray PLoS Medicine
Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe Dane o mutacjach M. Tuberculosis - zasoby Baza danych mutacji M. Tuberculosis, dla każdego leku przechowuje listę genów, w których zaobserwowano mutacje związane z opornością. Dla każdego genu, zawierającego przynajmniej jedną mutację przechowuje listę informacji wraz ze szczegółowymi informacjami. Dla danej mutacji zawiera informacje o typie mutacji (insercja, delecja, zamiana nukleotydu), położeniu w genomie, oraz informacje statystyczne: ilość opornych do wszystkich przebadanych izolatów, które potwierdziły mutację. Dane o mutacjach zostały wybrane z publikacji w bazach MEDLINE i EMBASE opisujących eksperymenty kliniczne. Mutacje są wykrywane względem referencyjnego genomu szczepu podatnego na leki, zazwyczaj H37Rv. Cała baza dostępna w jednym pliku Excel
Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe Dane o mutacjach M. Tuberculosis - strona
Baza danych leków Wprowadzenie Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe DrugBank - Baza danych leków wraz ze szczegółowymi informacjami na ich temat (np. wzór, struktura 3D, masa) jak również interakcji pomiędzy lekiem a bakterią tzn. białka atakowane przez lek, jak również enzymy biorące udział w metabolizmie leku. Zawiera prawie 4800 leków, z czego 19 dla M. tuberculosis.
Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe Praca opisująca mechanizmy oporności na leki Mechanisms of drug resistance in Mycobacterium tuberculosis Y. Zhang, W. W. Yew
Graf ścieżek metabolicznych Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe G = (V, E); gdzie : V = V 1 V 2 V 1 - zbiór wierzchołków reprezentujących metabolity reakcji (małe kółka) V 2 - zbiór enzymów (białek lub kompleksów białek) katalizujących reakcję (prostokąty) E - krawędzie skierowane pomiędzy metabolitami i enzymami reakcje chemiczne reprezentowane są w postaci: metabolity (substraty) enzymy metabolity (produkty)
Fragment ścieżki metabolicznej Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe
Genomy i funkcje genów Mutacje Leki i interakcje z M. tuberculosis Ścieżki metaboliczne i sygnałowe Zasoby KEGG - Kyoto Encyclopedia of Genes and Genomes KEGG przechowuje ścieżki reprezentujące różne typy interakcji molekularnych, według podziału na szlaki metaboliczne oraz niemetaboliczne, takie jak ścieżki przetwarzania informacji genetycznej, oraz inne procesy komórkowe. Ścieżki reprezentowane są jako grafy składające się z wierzchołków (geny, białka, małe molekuły, itp.) oraz krawędzi (reakcje, interakcje oraz relacje). H37Rv (98 + 13), łącznie 1008 białek sumując po wszystkich ścieżkach H37Ra (93 + 13) CDC1551 (99 + 13) F11 (82 + 13) KZN 1435 (78 + 13)
Dane mikromacierzowe I Dane mikromacierzowe i sieci koekspresji Sieci regulacji genów Sieci interakcji
Dane mikromacierzowe II Dane mikromacierzowe i sieci koekspresji Sieci regulacji genów Sieci interakcji Podstawowe typy eksperymentów: Ekspresja pod wpływem leków Ekspresja pod wpływem innych czynników stresu (np. zmniejszona ilość tlenu) Różnice w ekspresji pomiędzy szczepami Bazy danych: GeoNCBI EBI - ArrayExpress Stanford University Microarray database Duża ilość danych mikromacierzowych, każdego z tych trzech rodzajów, dla wielu leków oraz innych czynników stresu. Są również dane o pomiarach w różnych punktach czasowych.
Sieci koekspresji Wprowadzenie Dane mikromacierzowe i sieci koekspresji Sieci regulacji genów Sieci interakcji G = (V, E); cor : E [ 1, 1] V - zbiór wierzchołków reprezentujących geny E - zbiór krawędzi reprezentujących statystycznie istotną korelację ekspresji genów cor - waga na krawędziach reprezentująca korelację ekspresji genów Sieci koekspresji były konstruowane w przynajmniej jednej z prac (Differential network expression during drug and stress response) w celu opisania pewnego podejścia, nie są jednak dostępne do pobrania.
Sieci regulacji genów Dane mikromacierzowe i sieci koekspresji Sieci regulacji genów Sieci interakcji Sieć regulacji genów jest to sposób organizacji zależności w procesie tworzenia białek. Podstawowe modele sieci regulacji dzielą się na deterministyczne i stochastyczne.
Sieci regulacji - modele ciągłe Dane mikromacierzowe i sieci koekspresji Sieci regulacji genów Sieci interakcji Procesy komórkowe to system reakcji chemicznych. Równania opisujące koncentrację związków chemicznych (np. białek, czynników transkrypcyjnych) są postaci: dx i (t) dt = f i (x 1, x 2,..., x n); 1 i n, gdzie [x 1,...x n], to wektor nieujemnych liczb rzeczywistych opisujących koncentrację, f i : R n R to funkcja opisująca zależności w ekspresji i- tego związku od pozostałych. Jeżeli mamy dane o ekspresji genów dla wielu punktów czasowych, możemy aproksymować pochodną x i : x i (t j+1 ) x i (t j ) t j+1 t j = f i (x 1, x 2,..., x n); 1 i n.
Sieci regulacji - modele Bayesowskie Dane mikromacierzowe i sieci koekspresji Sieci regulacji genów Sieci interakcji
Sieci regulacji - modele Boolowskie Dane mikromacierzowe i sieci koekspresji Sieci regulacji genów Sieci interakcji
Sieci regulacji - dostępne dane Dane mikromacierzowe i sieci koekspresji Sieci regulacji genów Sieci interakcji From Corynebacterium glutamicum to Mycobacterium tuberculosis towards transfers of gene regulatory networks and integrated data analyses with MycoRegNet Justina Krawczyk, Thomas A. Kohl, Alexander Goesmann, Jorn Kalinowski, Jan Baumbach Nucleic Acids Research (2009) Obecnie bardzo mała ilość dostępnych, w zasadzie jedyna baza zawierająca sieć Tuberculosis, Sieć regulacji składa się jedynie z białek, zawiera informację o rodzaju regulacji (+ czy ), Zawiera sieci dla szczepów H37Rv oraz CDC1551, Zidentyfikowano 1012 z 3991 białek MT jako ortologi do białek CG. Bazując na tym zmapowano 226 z 806 interakcji regulujących z dużym prawdopodobieństwem zachowanych w MT. 42 białka zaklasyfikowano jako czynniki transkrypcyjne
Reprezentacja Wprowadzenie Dane mikromacierzowe i sieci koekspresji Sieci regulacji genów Sieci interakcji G = (V, E); p : E R + gdzie: V - zbiór wierzchołków (białek) E - zbiór nieskierowanych krawędzi p - waga krawędzi reprezentująca prawdopodobieństwo wystąpienia danej interakcji (zależy np. od liczby eksperymentów, które potwierdziły daną interakcję)
Źódła danych STRING Dane mikromacierzowe i sieci koekspresji Sieci regulacji genów Sieci interakcji Każdemu typowi eksperymentów przypisane jest prawdopodobieństwo p i [0, 1]. Sumaryczne prawdopodobieństwo na krawędzi jest obliczane ze wzoru: p = 1 (1 p 1 ) (1 p 2 )... (1 p 7 )
Szczepy Tuberculosis w STRING Dane mikromacierzowe i sieci koekspresji Sieci regulacji genów Sieci interakcji W bazie STRING 8.2 znajdują się sieci interakcji dla 4 szczepów: H37Rv H37Ra CDC1551 F11
Projekt Wprowadzenie Cele i postęp Pierwszy eksperyment obliczeniowy Cel: Dokładniejsze zbadanie procesów nabywania oporności na leki przez M. tuberculosis. Ambitny cel: Stworzenie modelu nabywania oporności. Obecny postęp prac: Zebranie dostępnych danych: genomy i informacje o funkcjach białek, informacje o lekach, dane mikromacierzowe, sieci regulacji genów, sieci interakcji białek Pierwszy eksperyment obliczeniowy Zaplanowane zadania: Rekonstrukcja sieci lepiej modelującej procesy uzyskiwania oporności (np. sieci regulacji genów), oraz wykorzystanie zaimplementowanych narzędzi do jej analizy
Cele i postęp Pierwszy eksperyment obliczeniowy Praca wprowadzająca pojęcie co-targetu Mycobacterium tuberculosis interactome analysis unravels potential pathways to drug resistance Karthik Raman, Nagasuma Chandra 2008 BMC Microbiology
Schemat eksperymentu Cele i postęp Pierwszy eksperyment obliczeniowy
Cele i postęp Pierwszy eksperyment obliczeniowy Mechanizmy odpowiedzialne za oporność Mechanizmy odpowiedzialne za oporność zostały podzielone na cztery grupy: pompy usuwające leki z komórki cytochromy i inne enzymy modyfikujące cel działania leku, potencjalnie mogące powodować chemiczną modyfikację cząsteczek leku SOS i replikacja DNA prowadzące do mutacji w genach lub ich sekwencjach regulatorowych horyzontalny transfer genów
Definiowanie źródeł i ujść Cele i postęp Pierwszy eksperyment obliczeniowy źródło - białko będące celem leku ujście - białka biorące udział w mechaniźmie obronnym Trzy leki: isoniazid, ethionamide i isoxyl zatrzymują biosyntezę kwasów mykolowych, z których 26 znajdujących się na ścieżce MAP (Mycolic Acid Pathway) zostało użytych jako źródła. Wybrano listę 74 genów M. tuberculosis biorących udział w opisanych mechanizmach odpowiadających za oporność. Białka z tego zbioru zostały oznaczone jako ujścia.
Idea co-targetów Wprowadzenie Cele i postęp Pierwszy eksperyment obliczeniowy
Cele i postęp Pierwszy eksperyment obliczeniowy Uogólnienie pojęcia co-targetu i przeprowadzone obliczenia Co-target definiujemy w terminach sieci przepływowych. Dla ustalonego k naturalnego k-co-target to zbiór k białek, których usunięcie (oraz krawędzi incydentnych z nimi) minimalizuje maksymalny przepływ. Do obliczeń wykorzystałem te same zbiory białek jako źródła i ujścia co w pracy Ramana i Chandry. Zaimplementowałem: algorytm ( testujący wszystkie możliwe kombinacje (złożoność n ) k maxflow()) algorytm wyznaczający minimalny zbiór wierzchołków zatrzymujący przepływ heurystykę budującą rozwiązanie dla k + 1 poprzez rozszerzenie rozwiązania dla k o najlepszy wierzchołek (złożoność n k maxflow()).
Przykładowe wyniki Wprowadzenie Cele i postęp Pierwszy eksperyment obliczeniowy Eksperyment potwierdził białko (Rv0892) wskazane przez Ramana i Chandrę jako potencjalnie dobry co-target.
Pomysł Wprowadzenie Cele i postęp Pierwszy eksperyment obliczeniowy