Bioinformatyka Wykład 2. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas Budowa aminokwasów i białek Bioinformatyka 2, 2011 1
Ogólna budowa aminokwasów H w neutralnym ph H NH 3 + C COO - NH 2 C COOH R R grupa aminowa - NH 2 grupa karboksylowa - COOH Ogólna budowa aminokwasów - glicyna H NH 2 C COOH H R = H Gly, G Bioinformatyka 2, 2011 2
Ogólna budowa aminokwasów - alanina H NH+ 3 C COO - CH 3 R = CH 3 alfa- amiokwasy L - aminokwasy Ala, A L-aminokwasy - centrum asymetrii NH 3 + H R H NH 3 + C C COO - L D COO - Bioinformatyka 2, 2011 3
Reguła CORN H R NH 3 + C L lewoskrętny (COO-R-N) COO - 20 aminokwasów białkowych kod 1- i 3- literowy nazwa symbol skrót alanina A Ala arginina R Arg asparagina N Asn kw.asparaginowy D Asp cysteina C Cys glutamina Q Gln kw.glutaminowy E Glu glicyna G Gly histydyna H His izoleucyna I Ile nazwa symbol skrót leucyna L Leu lizyna K Lys metionina M Met fenyloalanina F Phe prolina P Pro seryna S Ser treonona T Thr tryptofan W Trp tyrozyna Y Tyr walina V Val Bioinformatyka 2, 2011 4
Glicyna i Alanina Ala, A Gly, G Aminokwasy alifatyczne Bioinformatyka 2, 2011 5
Cykliczna struktura proliny Pro Aminokwasy alifatyczne zawierające grupę hydroksylową dzięki grupie -OH aminokwasy te są hydrofilowe Bioinformatyka 2, 2011 6
Cysteina Aminokwasy z grupą karboksylową lub karboksyamidową kw.asparaginowy Asp, D kw.glutaminowy Glu, E asparagina Asn, N glutamina Gln, Q Bioinformatyka 2, 2011 7
Aminokwasy zasadowe - (naładowane dodatnio) Aminokwasy aromatyczne Bioinformatyka 2, 2011 8
cechy/kryteria podziału: Ze względu na wpływ na strukturę białka lub ze względu na jego właściwości fizyko-chemiczne: hydrofobowe/hydrofilowe alifatyczne aromatyczne, oddziaływujące warstwowo polarne-neutralne polarne naładowane dodatnio/ujemnie kwasowe, zasadowe C-β rozgałęzione małe/duże zawierające siarkę tworzące wiązania wodorowe wzmacniacze/łamacze struktur aminokwasy hydrofobowe/niepolarne A V L I P Y F W M C Ala Val Leu Ile Pro aromatyczne alifatyczne Tyr Phe Trp Cys Met zawierające siarkę Bioinformatyka 2, 2011 9
aminokwasy hydrofilowe/polarne N Q S T K R H D E N, Asn Q, Gln S, Ser T, Thr K, Lys naładowane (+) R, Arg H, His D, Asp E, Glu naładowane (-) Aminokwasy hydrofobowe V, I, L, M, F, W, C To takie aminokwasy, które nie lubią przebywać w środowisku wodnym. Najczęściej lokują się w hydrofobowym wnętrzu (jądrze) cząsteczki białka lub w lipidowej części błon komórkowych. mniej hydrofobowe: A, Y, H, T, S, P, G częściowo hydrofobowe: R, K, Np. hydrofobowa jest część łańcucha bocznego najbliższa do łańcuch głównego. (1) Janin, Surface and Inside Volumes in Globular Proteins, Nature, 277(1979)491-492. (2) R. Wolfenden, L. Andersson, P. Cullis and C. Southgate, Affinities of Amino Acid Side Chains for Solvent Water, Biochemistry 20(1981)849-855. (3) J. Kyte and R. Doolite, A Simple Method for Displaying the Hydropathic Character of a Protein, J. Mol Biol. 157(1982)105-132. (4) G. Rose, A. Geselowitz, G. Lesser, R. Lee and M. Zehfus, Hydrophobicity of Amino Acid Residues in Globular Proteins, Science 229(1985)834-838. Bioinformatyka 2, 2011 10
Aminokwasy naładowane Aminokwasy naładowane dodatnio: R, K, H, to aminokwasy, których reszty w fizjologicznym ph są zwykle protonowane (naładowane dodatnio). (Łańcuch boczny histydyny ma pka 6.5, zatem w warunkach fizjologicznych zaledwie 10% H jest protonowanych.) Aminokwasy naładowane ujemnie: E, D, To aminokwasy, które w neutralnym ph są zwykle deprotonowane (naładowane ujemnie) Diagram Venn a Specyficzne własności reszt aminokwasowych decydują o strukturze i aktywności biologicznej białek. Bioinformatyka 2, 2011 11
Nazwa Kod Masa (-H 2 O) Liczba atomów Objętość (Å 3 ) ε 280 (M -1 cm -1 ) alanina A, 71.079 10 71.07 1 arginina R, Arg 156.188 24 156.18 ~12.0 3 asparagina N, Asn 114.104 14 118.23 2 pk a h kwas asparaginowy D, Asp 115.089 14 133.30 4.5 6 cysteina C, Cys 103.145 12 109.80 9.3 1 glutamina Q, Gln 128.131 17 134.98 2 kwas glutaminowy E, Glu 129.116 17 122.816 4.6 7.5 glicyna G, Gly 57.052 7 60.75 1 histydyna H, His 137.141 18 155.53 5860 6.2 4 izoleucyna I, Ile 113.160 19 122.46 1 leucyna L, Leu 113.160 19 122.454 1 lizyna K, 128.17 22 143.23 10.4 4.5 metionina M, Met 131.199 19 139.115 1 fenyloalanina F, Phe 147.177 20 154.60 197 0 prolina P, Pro 97.117 14 78.02 3 seryna S, Ser 87.078 11 65.09 2 treonina T, Thr 101.105 14 102.426 2 tryptofan W, Trp 186.213 24 197.47 5600 2 tyrozyna Y, Tyr 163.176 21 160.42 1420 9.6 3 walina V, Val 99.133 16 105.70 1 Właściwości fizyko-chemiczne białka Cechy aminokwasów masa stała dysocjacji współczynnik ekstynkcji średnia objętość w strukturze natywnej średnia liczba cząsteczek wody Właściwości fizyczne białka masa objętość całkowita objętość właściwa stopień hydratacji współczynnik dyfuzji/promień hydratacji Bioinformatyka 2, 2011 12
Lizozym (białko jaja kurzego) >6LYZ:_ PDBID CHAIN SEQUENCE KVFGRCELAAAMKRHGLDNYRGYSLGNWVCAAKFESNFNTQATNRNTDGS TDYGILQINSRWWCNDGRTPGSRNLCNIPCSALLSSDITASVNCAKKIVS DGNGMNAWVAWRNRCKGTDVQAWIRGCRL M w = 14302 Da V = 16728.9 Å 3 v 2 = 0.704 cm 3 /g h r = 270 mol/mol δ 1 hydratacja = (h r M H2O /M w ) = 0.34 g H2O /g białka R o promień równoważnej kuli = (3V/4Π) 1/3 = 15.9Å R h promień hydratowanej kuli = (3V h /4Π) 1/3 = 17.9Å V h objętość hydratowanej kuli = V + V H2O = = V + δ 1 v 1 M w /N A Molowy współczynnik absorpcji (model Edelhoch a, roztwór denaturujący:6m Gdn-HCl ) absorpcja Tyr, Trp i Cys nie różni się znacząco w różnych roztworach białka nie zawierają innych chromoforów w UV λ=280 nm ε MTyr = 1280 ε MTrp = 5690 ε MCys = 180 ε MCys-Cys = 120 ε MGdn = (N Tyr ) ε MTyr + (N Trp ) ε MTrp + (N Cys ) ε MCys Bioinformatyka 2, 2011 13
Molowy współczynnik absorpcji (Lizozym) >6LYZ:_ PDBID CHAIN SEQUENCE KVFGRCELAAAMKRHGLDNYRGYSLGNWVCAAKFESNFNTQATNRNTDGS TDYGILQINSRWWCNDGRTPGSRNLCNIPCSALLSSDITASVNCAKKIVS DGNGMNAWVAWRNRCKGTDVQAWIRGCRL λ=280 nm (N Tyr )=3 (N Trp )=6 (N Tyr ) =4 ε MGdn = 38010 (M -1 cm -1 ) (obliczenia) ε MGdn = 37860 (M -1 cm -1 ) (literatura) Molowy współczynnik absorpcji (Lizozym w roztworze natywnym) λ=280 nm Prawo Beera: A Gdn =ε MGdn lc MGdn A nativ =ε M lc M l = 1cm c M = c MGdn ε M = A nativ /A Gdn ε MGdn ε M = 38010 M -1 cm -1 ε = 2.65 cm -2 g -1 c M na 1OD 280 = 2.6 10-5 M c na 1OD 280 = 0.377 gcm -3 Bioinformatyka 2, 2011 14
ph punktu izoelektrycznego i ładunek pi = ph(net Charge =0) ładunek dodatni pk ai : Arg 12.48 Lys 10.53 His 6.00 ładunek ujemny pk aj : Asp 3.86 Glu 4.25 Tyr 10.07 Cys 8.33 N i suma Arg, Lys i His, N j suma Asp, Glu, Tyr, Cys Krzywa miareczkowania Lizozym: pi 9.215 max ładunek dodatni: 9 max ładunek ujemny: 20 Bioinformatyka 2, 2011 15
Łańcuch polipeptydowy - struktura pierwszorzędowa struktura I-rzędowa: kolejność, sekwencja aminokwasów w łańcuchu (skład i kolejność decydują strukturze i funkcji) Ala Gly Thr Ile Val NH 2 - AlaValGlySerThrLeuIle - COOH Ser Leu NH 2 - AVGSTLI - COOH Wiązanie peptydowe wiązanie peptydowe H + H 3 N C α C H O O + + H + H 3 N C α C H O O + H 2 O H O + H 3 N C α C H N H H C α H C O O + Bioinformatyka 2, 2011 16
1.23 Å 1.0 Å Kierunkowość łańcucha, nazewnictwo a) 4-Alanina lub tetra-alanina, b) tetrapeptyd o sekwencji R 1 R 2 R 3 R 4 Łańcuch aminokwasów: 2-10 oligopeptyd, 10-100 polipeptyd, powyżej 100 reszt aminokwasowych białko. Wiązanie peptydowe kąty walencyjne i długości wiązań R 2 O H NH 3 + 121.1 o C 123.2 o 121.9 o C C 115.6 o N 119.5 o 118.2 o C R 1 H 119.5 o H O Bioinformatyka 2, 2011 17
Definicja kąta torsyjnego D D A B C A B C 0 o Kąt dwuścienny 180 o 90 o Bioinformatyka 2, 2011 18
Wiązanie peptydowe kąt torsyjny ω -konformacja Trans R 2 ω=180 o O H NH 3 + C C C N C R 1 H H O Struktura drugorzędowa Przestrzenne ułożenie łańcucha opisane za pomocą kątów torsyjnych φ i ψ. ψ φ ω Bioinformatyka 2, 2011 19
Elementy struktury II-rzędowej helisy: prawoskrętna α helisa 3 10 helisa π helisa helisa φ ψ ω reszt na skręt przesunięcie na resztę wiązania wodorowe α helisa -57-47 180 3,6 1,5 i+4 3 10 helisa -49-26 180 3,0 2,0 i+3 π helisa -57-70 180 4,4 1,2 i+5 α - helisa Bioinformatyka 2, 2011 20
α - helisa 3 10 - helisa π - helisa 22-reszty aminokwasowe Elementy struktury II-rzędowej beta-harmonijki, (β-kartki, struktury pofałdowanej kartki): równoległe antyrównoległe mieszane harmonijka φ ψ ω równoległa -139 135 180 antyrównoległa -119 113-175 Bioinformatyka 2, 2011 21
β-harmonijki Wykres Ramachandrana (Biochemistry, Jeremy Berg, John Tymoczko, Lubert Stryer. 5th ed,pwn 2005). Bioinformatyka 2, 2011 22
Wykres Ramachandrana (Biochemistry, J.Berg, J.Tymoczko, L.Stryer.,PWN 2005). Wykres Ramachandrana dla białka φ ψ β-równoległa -119 113 β-antyrównoległa -139 135 α - helisa -57-47 3 10 - helisa -49-26 π - helisa -57-70 Bioinformatyka 2, 2011 23
Łamacze i wzmacniacze Wzmacniacze Łamacze - helisa M L E C A P G Y T S - harmonijka równoległa - harmonijka antyrównoległa kłębek, zwrot V I F M L Y Q T R H W C G P D N S Y, naładowane P G D E A N S K Wiązania wodorowe dla - harmonijki struktura równoległa struktura anty-równoległa Bioinformatyka 2, 2011 24
Wiązania wodorowe dla α - helisy i i+4 Wiązania wodorowe dla zwrotu (skrętu) Bioinformatyka 2, 2011 25
Rodzaje oddziaływań stabilizujących strukturę oddziaływania wodorowe oddziaływania hydrofobowe oddziaływania van der Waalsa mostki dwu-siarczkowe mostki solne Wiązanie wodorowe C oddz. elektrostatyczne między dwoma względnie elektroujemnymi atomami δ - O akceptor energia: 4-13 kj/mol (energia wiązań kowalencyjnych: 418 kj/mol) δ + H N donor δ - δ + δ - N H N N H O O H N O H O Bioinformatyka 2, 2011 26
Wiązanie wodorowe białko ligand Wiązanie wodorowe Bioinformatyka 2, 2011 27
Oddziaływania hydrofobowe Zasady termodynamiki: układ ciepło otoczenie I. Energia otoczenia i układu jest stała II. W procesach spontanicznych entropia rośnie (ΔS>0) S - entropia - miara przypadkowości i nieuporządkowania H - entalpia - zawartość ciepła w układzie (zwiększenie = wzrost entropii) G - energia swobodna (Gibbsa) ΔS otoczenia = -ΔH układu /T ΔG = ΔH układu -TΔS układu < 0 Reakcja zajdzie spontanicznie jeśli ΔG < 0 Oddziaływania hydrofobowe -spontaniczne zwijanie białek układ nieuporządkowany - duża entropia (S) Bioinformatyka 2, 2011 28
Oddziaływania hydrofobowe -spontaniczne zwijanie białek układ nieuporządkowany: - grupy hydrofobowe porządkują cząsteczki wody - spadek entropii grupy hydrofilowe grupy hydrofobowe Oddziaływania hydrofobowe -spontaniczne zwijanie białek układ uporządkowany (niższa entropia?): - grupy hydrofobowe połączone - uwolnione cząsteczki wody są nieuporządkowane - wzrost entropii grupy hydrofilowe grupy hydrofobowe Bioinformatyka 2, 2011 29
Oddziaływania hydrofobowe -spontaniczne zwijanie białek układ uporządkowany (niższa entropia?): - grupy hydrofobowe połączone - uwolnione cząsteczki wody są nieuporządkowane - wzrost entropii ΔS wody = -ΔH białka /T wzrost entropii wody kompensuje jej spadek związany ze zwijaniem białek! ΔG = ΔH białka -TΔS białka < 0 grupy hydrofilowe grupy hydrofobowe Rodzaje oddziaływań stabilizujących strukturę oddziaływania wodorowe oddziaływania hydrofobowe oddziaływania van der Waalsa mostki dwu-siarczkowe mostki solne Bioinformatyka 2, 2011 30
Oddziaływania van der Waalsa ładunek - dipol dipol dipol (Debay) dyspersja (indukowane dipole, London) δ - δ + N + O C δ + C δ - O δ + C OH δ + δ - δ + δ - CH 3 H 3 C Mostek dwu-siarczkowy --CH 2 -S-S-CH2-- Bioinformatyka 2, 2011 31
Struktura trzeciorzędowa przestrzenne ułożenie elementów struktury II-rzędowej pojedynczego łańcucha Struktura czwartorzędowa Przestrzenne ułożenie dwóch lub więcej łańcuchów polipeptydowych tworzących natywną cząsteczkę białka białko Cro z bacteriofaga l, jest dimerem złożonym z identycznych podjednostek Bioinformatyka 2, 2011 32
Struktura VI-rzędowa dimer hemoglobiny tetramer 2 2 hemoglobiny (1G0B.pdb) Struktura IV-rzędowa Ferytyna - 24mer (1BG7.pdb) Insulina (1APH.pdb) Bioinformatyka 2, 2011 33
Oddziaływanie białek z ligandami Jądrowy receptor hormonu Grupy prostetyczne to często kofaktory Apoproteina - białko bez grupy prostetycznej Klasyfikacja struktur białkowych CATH - CATH Protein Structure Classification http://www.cathdb.info/ SCOP - The Structural Classification of Proteins http://scop.mrc-lmb.cam.ac.uk/scop/ Bioinformatyka 2, 2011 34
CATH - CATH Protein Structure Classification C - Class, zawartość struktur II-rz. A Architecture, zbiory topologii o wspólnych cechach T Topology, rodziny pofałdowań, o dużym podobieństwie strukturalnym, ale bez homologii H Homologous Superfamily, podobieństwo wynikające z pokrewieństwa C- klasy (CATH) klasa 1. głównie (Mainly Alpha) klasa 2. głownie (Mainly Beta) klasa3. mieszane i (Mixed Alpha-Beta) klasa 4. nieregularne (Few Secondary Structures) Bioinformatyka 2, 2011 35
Architektura Klasy 1. (CATH) Architektura Klasy 1. (CATH) Bioinformatyka 2, 2011 36
Architektura Klasy 2. (CATH) Architektura Klasy 2. (CATH) Bioinformatyka 2, 2011 37
Architektura Klasy 2. (CATH) Motywy strukturalne motywy strukturalne - struktury naddrugorzędowe:motyw all-β topologie beta-beczka (barrel) 1ifb.pdb Bioinformatyka 2, 2011 38
Motywy strukturalne beta-helisa 2pec.pdb Motywy strukturalne motywy strukturalne - struktury naddrugorzędowe:motyw α-β- α-β α-β -beczka Bioinformatyka 2, 2011 39
czas Rodziny, superrodziny Drzewo ewolucyjne globin. homologi: ortologi -różne gatunki, taka sama funkcja paralogi-podobna funkcja, ale ewoluowały niezależnie (ten sam organizm) analogi: różne sekwencje, różne motywy, ale identyczna orientacja ważnych aminokwasów prymitywna, pierwotna globina wiążąca tlen Molecular Cell Biology,4ed. Lodish, Berk, Matsudaira, Kaiser, Krieger, Scott, Zipursky, and Darnell krowa Rodzina - homologi Rybonukleaza wołowa (enzym trawienny) człowiek Rybonukleaza ludzka (enzym trawienny) angiogenina ludzka (stymuluje wzrost naczyń krwionośnych) (Biochemistry, J.Berg, J.Tymoczko, L.Stryer.,PWN 2005). Bioinformatyka 2, 2011 40
Rodziny Domeny, motywy, rodziny, superrodziny domeny - odrębne strukturalnie fragmenty białek domena wiążąca palca cynkowego Bioinformatyka 2, 2011 41
Bioinformatyka 2, 2011 42