Metody dokowania ligandów
Strategie projektowania leków Ligand-based drug design nieznana Budowanie modelu miejsc aktywnych liganda (farmakofor) Przeszukiwanie baz danych (screening) Struktura celu molekularnego znana 1D i 3D QSAR (pseudoreceptory i pola molekularne) Dopasowanie ligandów do miejsca aktywnego receptora (dokowanie) Budowa nowych ligandów ab-initio Receptor-based drug design Dynamika kompleksu receptor-ligand
Dokowanie znajdowanie struktury kompleksu o najniższej energii (najbardziej dopasowany) Energia lub tzw. scoring function (kształt i właściwości fizykochemiczne)
Energia a potencjał termodynamiczny mechanika molekularna Energia jest użyteczna przy porównywaniu różnych konformacji kompleksu
Trzy składniki programów do dokowania a) b) c) Atomic Surface Grid (najbardziej dokładna reprezentacja) Algorytmy szukania konformacji i wyznaczania energii są ściśle ze sobą związane
Dokowanie przez komplementarność powierzchni H hole, K knob; sposób używany w b. wielu programach dokujących
Reprezentacja białka przez grid (sieć) W każdym punkcie sieci mierzymy wielkość oddziaływań niewiążących: - Van der Waalsa - Elektrostatyczne Oczka sieci ok. 2 Å Zmierzone wielkości są zapamiętywane w tabeli Pierwsze użycie: Goodford 1985 r.
Użycie gridu do uproszczenia dokowania Dla każdego atomu liganda liczone jest oddziaływanie od otaczających punktów sieci (odcięcie cutoff ok. 10 Å) Dodatkowe przyspieszenie: Dla każdego typu atomu liganda w każdym węźle sieci energia jest obliczana i przechowywana w tabeli Potencjał dla danego atomu liganda jest obliczany przez interpolację z otaczających punktów gridu Metoda często używana w symulacjach typu virtul reality
Trudności w doborze scoring function Który enancjomer liganda jest aktywny a który nieaktywny?
Czynniki wpływające na wiązanie ligandów
Korzystne oddziaływania Oddziaływania kierunkowe i silne Oddziaływania van der Waalsa: bezkierunkowe i słabe lecz liczne
Energie częściowej desolwatacji liganda i miejsca aktywnego Proces kierowany termodynamicznie (efekty entropowe) Części hydrofobowe oddziałują ze sobą aby zmniejszyć oddziaływania z otaczającą wodą
Konformacyjne efekty entropowe Konformacja bioaktywna (w miejscu aktywnym) może być inna niż na zewnątrz Dotyczy także konformacji białka: głównie konformacji łańcuchów bocznych aminokwasów z miejsca aktywnego Konieczne jest dokowanie wielu różnych konformacji liganda
Wiązanie liganda jako reakcja równowagowa Ln (K) Stała K jest mierzona doświadczalnie. K F stała tworzenia [M -1 ] K D stała dysocjacji [M]
Empiryczne funkcje oceniające Współczynniki wagowe k uzyskuje się w procesie parametryzacji (kalibracji) wybranego pola siłowego (k mogą być dodatnie lub ujemne) Pole siłowe skalibrowane dla kompleksów ze zbioru treningowego: znane są struktury 3D i aktywności biologiczne ligandów w tych kompleksach
Przykład empirycznej funkcji oceniającej z programu AutoDock (obliczane z solvent excluded volumes) Obliczane są tylko niektóre składowe pola siłowego
Powierzchnia dostępna dla rozpuszczalnika Connoly surface (wygładzona powierzchnia molekularna) Solvent accessible surface area Promień kulki dla wody = 1.4 Å
Funkcje oceniające oparte na wiedzy (knowledge based scoring functions) - wykorzystanie Bazują na odległościach w strukturach 3D kompleksów ligand-cel molekularny
Funkcje oceniające oparte na wiedzy otrzymywanie Dla każdej pary oddziałujących atomów (typów atomów) obliczany jest wykres PMF (Potential of Mean Force) K D rozkład Boltzmanna g ij ~ exp(-e ij /kt) E ij ~ ln(g ij ) * kt E ij = ln (g ij / g ref ) Dla 126 typów atomów w białku i 34 typów atomów w ligandach obliczanych jest 4284 wykresów PMF
Inne potencjały statystyczne Częstości dla kątów torsyjnych Wykresy 2D otrzymane dla częstości kątów dla aminokwasów
Przykład użycia funkcji oceniającej opartej na wiedzy w programie DrugScore 1400 kompleksów ligand-białko z bazy PDB (G. Klebe, Marburg University) G ref (R) wykres dla wszystkich ligandów (kolor czarny)
Funkcje oceniające są wrażliwe na wybór kompleksów ligand-białko do zbioru treningowego Większy zbiór kompleksów zapewnia większą dokładność funkcji oceniającej dla średniego białka
Inne funkcje oceniające wiązanie ligandów dokładność vs. szybkość
Komplementarność kształtu i własności w układzie ligand-cel molekularny Zwykle używane jako wstępne oszacowanie. Dodawane komplementarne własności: wiązania wodorowe, hydrofobowość, mostki solne itp.
Prosta metoda szacowania komplementarności powierzchni Metoda jest oparta na 3D grid
FEP - Free Energy Perturbation najbardziej dokładna z funkcji oceniających 1) Wymaga długiego czasu obliczeń (wymaga dynamiki molekularnej) 2) Pozwala tylko porównywać ligandy 3) Daje dobre wyniki tylko przy małych zmianach liganda w miejscu aktywnym
Free Energy Perturbation Cykl termodynamiczny dla obliczania energii wymiany liganda w białku (FEP Free Energy Perturbation) G X + G C = G F + G Y G wymiany liganda = G X - G Y = G F - G C
Zmiana położenia liganda w miejscu aktywnym Ligand i białko traktowane jako sztywne obiekty
Podział algorytmów dokujących Algorytm szuka komplementarnych własności Algorytm eksploruje całą dostępną przestrzeń
Feature-based matching - idea Pattern recognition (algorytmy z analizy obrazów, robotyki, )
Dopasowanie oparte na komplementarności i podobieństwie
Etapy feature-based matching Podobne do układania puzzli
Programy stosujące feature-based matching Pierwszy program DOCK z 1982 r.
Program DOCK (algorytm clique-search) - kieszeń receptora jest odwzorowana sferami; - min. 4 atomy liganda muszą się nałożyć na środki sfer.
Cel algorytmu dokującego programu DOCK 1. Metoda najprostsza i najdłuższa: sprawdzić nakładanie wszystkich par; 2. Użycie grafu dokującego i szukanie tzw. maximum clique.
Idea algorytmu clique-search (oparty na teorii grafów) W powyższym przykładzie: miejsca B-1 i C-2 mogą być dopasowane do siebie jednocześnie gruba linia na grafie
Znajdowanie maximum clique Miejsca D-1, C-2 i B-3 mogą być dopasowane do siebie jednocześnie. Linie reprezentują dopasowanie odległości.
Szybkie znajdowanie pasujących własności Przykład: poszukiwanie trójkątów ADD (Akceptor, Donor, Donor) z określonymi odległościami. Użycie hash tables znacznie przyspiesza poszukiwania (porównuje się tylko indeksy nie oblicza odległości)
Klastrowanie póz ligand-receptor Użycie geometrycznego haszowania (hashing) znacznie przyspiesza ten proces. Hash tables oblicza się tylko raz dla każdego liganda.
Program PatchDock dokowanie ligand-białko i białko-białko (Connoly dot surface) (klastrowanie wg. RMSD) PatchDock dokowanie łatek
Przygotowanie białka do dokowania formy tautomeryczne i minimalizacja energii
Przygotowanie liganda do dokowania 2D 3D, usuwanie soli itp. Dla struktur alternatywnych NH 2 NH 3+, COOH COO - chiralne lub N-N(H) (H)N-N cis-trans Analiza konformacyjna w próżni lub w roztworze wodnym
Dokowanie molekularne pozwala wyjaśnić jak małe zmiany struktury liganda mogą powodować duże zmiany aktywności
Metody optymalizacyjne znajdowania najlepszego dopasowania liganda
Schemat metody Monte Carlo
Schemat metody Simulated Annealing Cykl ogrzewania i powolnego oziębiania układu jest powtarzany wiele razy aż do znalezienia wielu prawie optymalnych rozwiązań. Ogrzewanie powoduje przekraczanie barier energetycznych a oziębianie pozwala na znalezienie układów z najniższą energią. Zaimplementowana po raz pierwszy w AutoDocku.
Zasada działania Algorytmów Genetycznych
Krzyżowanie i mutacje w GA przy dokowaniu Dokowanie sztywne (tylko rotacje i translacje)
Algorytmy Genetyczne Lamarcka (LGA) z lokalną optymalizacją Procedura stosowana obecnie w AutoDocku
Tabu search (TS) Pozwala na wyjście z lokalnych minimów kosztem przejściowego zaburzenia układu (stopniowe zasypywanie lokalnych minimów energii)
Metoda hybrydowa dokowania (TS+GA)
Dokowanie giętkich ligandów Rozwój metod giętkiego dokowania zapoczątkował nową dziedzinę projektowania leków: structure-based drug design
Metody do giętkiego dokowania ligandów
Dokowanie zespołowe/całościowe (ensemble docking) Efektywne unikanie błędnych dokowań Łatwa implementacja do dokowania podobnych związków z dużych baz danych
Dokowanie fragmentowe (fragmentation docking) Metody dokowania fragmentowego: - Place-and-join (fragmenty dokowane niezależne) - Inrcremental approach (fragmenty dokowane zależne od siebie)
Metoda ułóż i połącz (place-and-join) Wybór nieoptymalnych dokowań cząstkowych aby połączyć fragmenty (wskazówki do modyfikacji struktury liganda)
Metoda stopniowego dokowania fragmentów (incremental approach) Najpierw dokuje się rdzeń liganda a następnie po kolei pozostałe fragmenty minimalizując energię powstającego liganda
Wybór położenia pierwszego fragmentu ma wpływ na wynik dokowania Wybór najlepszego dopasowania na podstawie funkcji oceniającej poszczególne pozy
Przykłady zastosowań dokowania giętkiego w programach GOLD algorytmy genetyczne (GA) MOE-Dock Monte Carlo (MC), Tabu search PRO_LEADS algorytmy genetyczne AutoDock algorytmy genetyczne, Tabu search Kąty torsyjne giętkiego liganda wprowadza się do chromosomów w GA lub do parametrów do optymalizacji w MC
GOLD skład chromosomów w GA część chromosomu dotycząca giętkiego dokowania Dodatkowe śledzenie każdego potencjalnego wiązania wodorowego pomiędzy ligandem i białkiem w celu maksymalizacji ich liczby
Ważność giętkiego dokowania W 50% przypadków sztywne kros-dokowanie prowadziło do błędnych wyników
Inhibitory trombiny (proteaza serynowa tnie fibrynogen krzepliwość krwi) pochodna tetrazolowa porównanie struktur trombiny + CXCR4 62
Uwzględnianie giętkości białka
Miękkie dokowanie ligandów Pozwala na niewielkie nakładanie się struktur liganda i receptora Modyfikacja potencjału Lennarda-Jonesa (LJ) aby siły van der Waalsa były mniej odpychające (plastyczność receptora bez zmiany jego konformacji)
Miękkie dokowanie ligandów Zmniejszanie promieni van der Waalsa (rozmiarów atomów) dla liganda i receptora Modyfikacja potencjału elektrostatycznego
Miękkie funkcje oceniające (soft scoring) Soft scoring jest stosowana jako wstępna funkcja oceniająca do szybkiego odsiania niepasujących ligandów
Uwzględnianie ruchów łańcuchów bocznych w białku Rozwiązanie: biblioteka konformerów aminokwasów (1987 Ponder & Richards) eksplozja konformacyjna
Złożoność obliczeniowa przy giętkim dokowaniu Oszacowanie na jeden CPU
Metoda Multiple protein structure (MPS) Białko CDK2 (Cyclin-Dependent Kinase 2 )
Źródła struktur do metody MPS Metoda Zalety Wady Metody doświadczalne (X-ray, NMR) Biblioteki rotamerów Dynamika molekularna Analiza drgań normalnych Rzeczywiste rotamery Dostępność Dostępność, konformery o niskiej energii Dostępne duże zmiany strukturalne Mała dostępność Tylko standardowe łańcuchy boczne Czas obliczeniowy, brak weryfikacji dośw. Brak weryfikacji dośw.
Metoda łączonych białek united protein approach Program FlexE. Nałożone struktury białka pozwalają na zbudowaniu wielu wirtualnych konformacji Sposób dokowania ligandów
Metoda uśrednionego gridu Energie oddziaływania liczone dla każdej struktury białka oddzielnie Uśredniony grid
Tolerancja dokowania ligandów
Uwzględnianie dużych ruchów białka wiązanie substratu przez kalmodulinę
Badania zmian w białku metodami symulacyjnymi możliwości i ograniczenia MD kompleksu biotyna-streptawidyna
Ruchy zawiasowe białek Identyfikacja zawiasów
Dokowanie ze zginaniem domen Bardziej efektywny algorytm
Zastosowania dokowania hamowanie oddziaływania dwu białek Analiza oddziaływań
Budowanie zapytania do baz danych ligandów
Sprawdzanie hipotez wiązania ligandów Inhibitor kinazy CDK2 Dokowanie pozwala sprawdzić hipotezy
Identyfikacja błędnej hipotezy Pochodne adeniny Wiązanie się części adeninowej w innej orientacji
Wyznaczanie potencjału związku do jego późniejszej modyfikacji
Modyfikacje liganda (inhibitory trombiny join.sce) Modyfikacje ligandów aby zwiększyć oddziaływania z receptorem Manualne modyfikacje liganda Automatyczne budowanie de-novo z fragmentów
Przewidywanie konformacji bioaktywnej i tworzenie farmakoforów
Programy do dokowania
Program GOLD Własności: - Algorytmy genetyczne do dokowania ligandu - Giętki ligand i częściowo giętkie białko - Funkcje oceniające oparte na strukturach realnych ligandów - Możliwość wyboru funkcji oceniającej Dokowanie inhibitora do metaloproteazy (porównanie ze strukturą krystaliczną)
Program GLIDE (Schrödinger Inc.) Stosowana szybka metoda systematycznego przeszukiwania (powrót do tej metody za sprawą komputerów wieloprocesorowych i obliczeń masywnie równoległych)
Procentowe użycie poszczególnych programów do dokowania
Przykłady leków uzyskanych przy użyciu dokowania
Dynamika molekularna schemat obliczeń F(t) i = m i * a(t) i II zasada ruchu Newtona a(t) i = F(t) i / m i a(t) i v(t) i r(t+ t) i t = 1 fs = 10-15 s r(t+ t) i F(t+ t) i
Metody symulacyjne - Dynamika Molekularna Zgodnie z prawami dynamiki ruchu Newtona. Trajektoria ruchu jest otrzymywana przez rozwiązanie równań różniczkowych: (F = ma) d x dt Algorytm całkowania numerycznego szybkość obliczeń, stałość energii całkowitej (zasada zachowania energii) 2 i 2 F x m r(t+ t) = r(t) + t v(t) + ½ ( t) 2 a(t) +... v(t+ t) = v(t) + t a(t) +... i i metoda skończonych różnic: algorytm Verleta (najbardziej popularny) [Verlet 1967] i modyfikacje: leap-frog [Hockney 1970], metoda Beemana [Beeman 1976]; metoda predykcyjno-korekcyjna [Gear 1971]
Symulacje MD energia układu E całkowita E kinetyczna i potencjalna różnice E całk zależą też od wyboru kroku czasowego obliczeń t.
Wybór kroku czasowego obliczeń Jeśli energia kinetyczna przekroczy progową wielkość (tu: przyciąganie się atomów Ar) atomy rozbiegają się. Krok czasowy powinien być porównywalny z częstotliwością najszybszych ruchów w cząsteczce (jeśli nie są one celem badawczym można je "zamrozić" np. stałe długości wiązań i wydłużyć krok obliczeń). (Ar 2 ) układ atomy sztywne cząsteczki giętkie cząsteczki, sztywne wiązania giętkie cząsteczki, giętkie wiązania Typ ruchu translacje translacje, rotacje translacje, rotacje, oscylacje translacje, rotacje, oscylacje cząsteczki i oscylacje wiązań Krok czasowy 10fs 5fs 2fs 1fs lub 0.5fs (z H)
Przypisanie prędkości początkowych T = 0K i stopniowe ogrzewanie do 300K lub prędkości przypadkowe zgodnie z rozkładem prędkości Maxwella-Boltzmanna. Monitorowanie parametrów układu należy rozpocząć po fazie równowagowania (equilibration). Dotyczy szczególnie układów heterogenicznych np. białko w otoczeniu rozpuszczalnika: minimalizacja rozpuszczalnika z przeciwjonami (białko nieruchome) dynamika rozpuszczalnika (białko nieruchome); czas > czas relaksacji samego rozpuszczalnika (dla H 2 O 10ps). minimalizacja całego układu start MD
Obliczanie temperatury E kin N i 1 2 p i 2m i kbt 2 3N N c N c - liczba więzów 3N - N c - całkowita liczba stopni swobody W układach izolowanych - całkowity pęd i moment pędu są zachowane i równe 0 przez dobór początkowych prędkości (N c = 6). W układach z periodic box moment pędu nie jest zachowany (N c = 3) albo można co jakiś czas odpowiednio skalować prędkości. Dodatkowe więzy na dowolnych współrzędnych wewnętrznych: SHAKE [Tobias & Brooks 1988] (łatwiejszy w implementacji) RATTLE [Anderson 1983]
Wybór warunków prowadzenia procesu Zespół mikrokanoniczny kanoniczny izotermalnoizobaryczny Wielkości stałe NVE NVT NPT Stan równowagi max. entropii (S) tradycyjna MD min. wolnej energii (A) tradycyjna MC min. pot. Gibbsa (G)
Zastosowanie ciągłego rozpuszczalnika dynamika stochastyczna (równanie ruchu Langevina): m i 2 d xi ( t) 2 dt F { x i i ( t)} i dxi ( t) dt m i R i ( t) - uwzględnienie sił tarcia ( m i v i ) - oraz ruchów Browna (przypadkowych zderzeń z cząsteczkami rozpuszczalnika pozwala na dłuższy krok czasowy umożliwia dużo dłuższe obliczenia niż z rozpuszczalnikiem explicite (szczególnie do polimerów) nie uwzględnia specyficznych oddziaływań z rozpuszczalnikiem (np. wiązania wodorowe)
Pudło periodyczne periodic box Liczba cząsteczek w pudle pozostaje stała. Periodic box pozwala na pozbycie się efektów brzegowych przy symulacjach w próżni (sfera rozpuszczalnika otacza badaną cząsteczkę) - napięcie powierzchniowe, parowanie. Aby zmniejszyć liczbę cząsteczek rozpuszczalnika lub dostosować do kształtu badanej cząsteczki (sfera, helisa) stosuje się różne kształty periodic box. Muszą wypełniać całą przestrzeń poprzez odpowiednie translacje komórki elementarnej. Periodic box dla symulacji ciał stałych: Powierzchnia kryształu jest granicą rzeczywistą. Kiedy molekuła wychodzi górą jest odbijana od górnej granicy.
Nieperiodyczne warunki brzegowe gdy bardzo duża cząsteczka lub gdy warunki nierównowagowe 1. symulacja w "kropli" rozpuszczalnika (10Å lub 5Å powłoka wokół badanej cząsteczki) enzym 2500 atomów w periodic box (odległość powierzchni białka do granicy pudła 10 Å) - razem 20,000 atomów kropla 10 Å - 14,700 kropla 5 Å - 8,900 2. Podział cząsteczki na miejsce aktywne (atomy mogą się poruszać), rezerwuar (pomiędzy R 1 i R 2 ) dozwolony ruch atomów tylko wewnątrz tej sfery. Reszta atomów nieruchoma lub ograniczona potencjałem harmonicznym do położeń początkowych. W obu tych metodach możliwe jest wystąpienie dużych efektów ubocznych w postaci sztucznych zjawisk nie obserwowanych w rzeczywistości
Promienie odcięcia (cutoff) dla oddziaływań van der Waalsa i elektrostatycznych Metoda PME (Particle Mesh Ewald) pozwala na obliczenia elektrostatyczne dalekozasięgowe (multipole zamiast ładunków cząstkowych na atomach) zamiast cutoff el-stat
Efekty działania potencjału - cutoff obliczenia oddziaływań niewiążących jest najbardziej czasochłonną częścią MD lub MC (ilość obliczeń N 2 ) dlatego wprowadza się do nich sferyczną granicę działania potencjału cutoff powinien być tak dobrany aby cząsteczka nie widziała swego własnego odbicia (mniejszy niż połowa długości najkrótszego boku komórki) (H 2 O) 2 (H 2 O) 2 cutoff = 8Å group-based cutoff potencjały przesuwane lub przełączane (np. na wielomian) Particle Mesh Ewald (PME)
Gładkie wyłączanie potencjału na granicy cutoff
Tworzenie listy par atomów dla oddziaływań niewiążących
Wybór długości symulacji
metoda Monte Carlo Algorytm Metropolisa [Metropolis et al. 1953]: nowy stan układu jest akceptowany zawsze jeśli ma energię niższą od poprzedniego stanu. jeśli ma wyższą energię - tylko wtedy jeśli czynnik Boltzmanna nie jest mniejszy od przypadkowej liczby z zakresu 0 1: Rozmiar każdego kroku musi być nie większy niż r max który jest tak określony, aby ok. 50% próbnych układów było akceptowanych. Jest on szacowany na początku i korygowany w trakcie obliczeń Podobnie jak w MD wymagana jest faza równowagowania układu przed fazą zbierania danych. W klasycznej netodzie MC T=const. i V=const. Można także używać zespołu NPT
Zmiana struktury w metodzie Monte Carlo we współrzędnych kartezjańskich: tylko małe zmiany są dozwolone aby nie zniekształcić cząsteczki - dużo więcej obliczeń. we współrzędnych wewnętrznych: można ustalić długości wiązań i kąty płaskie. Także małe zmiany kątów torsyjnych. MC jest stosowana głównie do modelowania uproszczonych modeli polimerów i biopolimerów rozpiętych na sieciach: sieć sześcienna sieć typu diamentu
Typy ruchów MC stosowanych w sieciach Przy szczególnie ciasno upakowanych polimerach jedynym możliwym ruchem może być ruch "wężowy": Modelowanie nieskończonych łańcuchów polimerów:
Próbkowanie przestrzeni konformacyjnej przy użyciu metod symulacyjnych Stosując odpowiednio wysokie temperatury (fizycznie niemożliwe) w MD i MC można przejść przez bardzo wysokie bariery energetyczne i zbadać całą przestrzeń fazową. Minimalizacja pozwala na uzyskanie lokalnych minimów. Simulated annealing [Kirkpatrick et al., 1983] Proces, w którym temperatura jest powoli obniżana a układ ma wystarczająco dużo czasu aby krystalizować bez defektów sieci. W wysokiej temperaturze układ jest równowagowany (MD lub MC) - może przechodzić przez wysokie bariery energetyczne. W miarę obniżania temperatury do 0 K osiąga się konformację o możliwie najniższej energii. Nie ma gwarancji osiągnięcia minimum globalnego ale stosując różne konformacje startowe można uzyskać prawie optymalne struktury.
Dynamika Molekularna z więzami Restrained Molecular Dynamics RMD i SA są wykorzystywane w X-ray i NMR do uzyskiwania końcowych struktur dużych cząsteczek. Dodatkowa funkcja kary jest dodawana do potencjału - podwyższa potencjał jeśli konformacja wykracza poza więzy. miara dopasowania - czynnik R struktury: R F - amplitudowe czynniki struktury F obs F obs F calc Metoda RMD zastąpiła metodę najmniejszych kwadratów prowadząc do lepszych struktur końcowych. Klejone potencjały stosowane w więzach: Dopasowywanie struktury cząsteczki do map gęstości elektronowej z X-ray
Porównanie algorytmów znajdowania konformacji Metoda systematyczne przeszukiwanie random search (cartesian) random search (internal) distance geometry molekularna dynamika Liczba konformacji 211 222 249 176 169 [Saunders et al., 1990] C 17 H 34 Całkowita liczba konformacji w zakresie 3 kcal/mol od minimum globalnego wyniosła 262 żadna z metod nie znalazła wszystkich konformacji zgodnie z rozkładem Boltzmanna konformacje minimum globalnego stanowią tylko 8% wszystkich konformacji (zakładając równość entropii tych konformacji).