Bioinformatyka wykład 12, 18.I.2011 Białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 18.01.11 1
Struktura natywna minimum energii swobodnej F = U TS Prawdopodobieństwo stanu ~ exp(-f/k B T) 18.01.11 2
Struktura natywna Christian Anfinsen, ok.1962 Thermodynamic hypothesis or Anfinsen's Dogma The native conformation is determined by the totality of interatomic interactions and hence by the amino acid sequence, in a given environment." 18.01.11 3
Efekt hydrofobowy węglowodór fosforan Entropia! 18.01.11 4
18.01.11 5
Plan wykładu proces zwijania się białek minimalizacja energii symulacje dynamiki molekularnej biblioteki struktur białkowych struktura pliku PDB 18.01.11 6
Droga zwijania (folding) zapadanie hydrofobowe hydrophobic collapse czy proces hierarchiczny 18.01.11 7
HOW DOES PROTEIN FOLD? and even more: How CAN protein fold spontaneously? Levinthal paradox (1968): Native protein structure reversibly refolds from various starts, i.e., it is thermodynamically stable. 18.01.11 8 But how can protein chain find this unique structure - within seconds - among zillions alternatives?
Nukleacja 18.01.11 9
Stopiona globuła molten globule 18.01.11 10
Stopiona globuła molten globule 18.01.11 11 lejek funnel
równowaga energia i entropia 18.01.11 12
Plan wykładu proces zwijania się białek minimalizacja energii symulacje dynamiki molekularnej biblioteki struktur białkowych struktura pliku PDB 18.01.11 13
Plan wykładu proces zwijania się białek minimalizacja energii symulacje dynamiki molekularnej biblioteki struktur białkowych struktura pliku PDB 18.01.11 14
Newtonowskie równania ruchu 18.01.11 15
Symulacja zwijania białka 18.01.11 16 Uproszczony model: pracownia A. Kolińskiego, UW
Plan wykładu proces zwijania się białek minimalizacja energii symulacje dynamiki molekularnej biblioteki struktur białkowych struktura pliku PDB 18.01.11 17
http://www.rcsb.org/ Protein Data Bank 18.01.11 18
RóŜne klasy metod przewidywania struktur Knowledge based methods comparative modelling twilight zone fold recognition 18.01.11 19 ab initio / de novo methods.
Modelowanie struktur oparte na wiedzy Rozpoznanie Czy istnieją dobrze scharakteryzowane białka podobne do mojego? Dopasowanie Jak dopasować sekwencje target/template? Modelowanie Jaka jest dokładna struktura 3D? 18.01.11 Funkcja Jaką aktywność ma białko? 20
Struktura przez analogię Identyczność sekwencji 100 75 Rozpoznanie Łatwe - BLAST, FASTA silne podobieństwo sekwencji, oczywiste Analogie funkcji 50 25 Trudne - PSI-BLAST - podobieństwo sekwencji - twilight zone, zróŝnicowanie funkcji Trudniejsze brak wyraźnego podobieństwa sekwencji, 0 18.01.11 duŝa dywergencja funkcji fold 21 recognition
Fold recognition trudne rozpoznawanie podobieństwa do znanych struktur Rozpoznanie Podobieństwo sekwencji (np. metody profilowe, tzn. porównywanie rodzin białek) Podobieństwo struktur dugorzędowych (przewidziane / rzeczywiste) Pasowanie sekwencji do struktur - tzw. potencjały statystyczne ( Threading ) 18.01.11 22
Budowa modelu mechanika molekularna więzy z dopasowania do struktury szablonu (template) ew. więzy z eksperymentu Modelowanie 18.01.11 23
Modelowanie porównawcze w róŝnych rolach Funkcja tradycyjnie Odległe podobieństwo białko-szablon Nie zawsze białkoszablon homologiczne oczywista analogia homologiczne funkcji funkcja nieoczywista zwykle jednozaczne dopasowanie moŝe dopasowanie być niejednozaczne modelowanie modelowanie dokowanie ligandów, analiza modelu szczegółowa analiza w celu określenia miejsca aktywnego,... funkcji 18.01.11 etc. etc. 24
Example: mechanism of action of an anti cancer drug (STI-571) Funkcja STI-571 binds to the Abl protein (left), however doesn't bind to Src, a similar oncogenic kinase (right) Cancer Fighter's Modus Operandi Revealed Jean Marx Science (2000), 289, 1121-2 18.01.11 25
De novo Zredukowane modele siatkowe Rosetta 18.01.11 26
PREDICTION FROM PHYSICS: PROTEIN CHAIN FOLDS SPONTANEOUSLY SEQUENCE HAS ALL INFO TO PREDICT: 2 O STRUCTURE, 3D STRUCTURE, SIDE CHAIN ROTAMERS, S-S BONDS, etc. 18.01.11 27
Przykład zredukowanej reprezentacji struktury białka uwzgędnia się tylko kilka quasiatomów na resztę aminokwasową - np. Cα Cβ ograniczona liczba moŝliwych połoŝeń quasi-atomów specjalne potencjały dla quasiatomów problem przejścia od reprezentacji zredukowanej do pełnej, atomowej metody często łączone z elementami rozpoznawania kształtw grupa Andrzeja Kolińskiego biocomp.chem.uw.edu.pl 18.01.11 28
Idea Rosetty David Baker, UW 18.01.11 29
Rosetta łańcuch główny uproszczony model Cα,Cβ: uwzględnienie preferencji konformacyjnych krótkich fragmentów wg. bibliotek struktur następnie udoskonalenie modelu (refinement) z wykorzystaniem potencjałów fizykochemicznych, opartych na analizie znanych struktur 18.01.11 30
Rosetta Low resolution all-atom 18.01.11 31
Rosetta - przykład 18.01.11 32