Bioinformatyka (wykład monograficzny) wykład 1. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas z sylabusu... Wykład 1, 2006 1
Co to jest Bioinformatyka? Zastosowanie technologii informacji do Biologii Analiza ogromnego zbioru informacji dotyczącego makrocząsteczek biologicznych Analiza sekwencji (i struktury) genów i białek Ogromny zbiór informacji? Zapis genomu człowieka, to stos pudełek z CD o wysokości 750 m. (80 000 płyt = ok. 50 TB) Świat Nauki Październik 2000 Wykład 1, 2006 2
Bioinformatyka pływanie w morzu informacji GenBank (Bank Genów) zgromadził dotąd zapisy sekwencji kwasów nukleinowych zawierających ponad 10 10 nukleotydów i co roku podwaja tą liczbę Science(2001)209 Centralny dogmat Biologii Molekularnej informacja genetyczna przechowywana jest w sekwencji zasad polimeru DNA trójki (tryplety) zasad DNA kodują 20 naturalnych aminokwasów sekwencja aminokwasów w białku determinuje jego strukturę sekwencja i struktura determinują funkcję Wykład 1, 2006 3
Dwa paradygmaty? Biologia molekularna DNA RNA białko Bioinformatyka sekwencja struktura funkcja Wykład 1, 2006 4
Prekursor mrna mrna (1) Sekwencja białka determinuje jego strukturę przestrzenną mrna (2) Sekwencja aminokwasowa (1) Sekwencja aminokwasowa (2) Budowa aminokwasów i białek Wykład 1, 2006 5
Ogólna budowa aminokwasów α w neutralnym p α N 2 C α COO N 3 + C α R COO - R grupa aminowa - N 2 grupa karboksylowa - COO Ogólna budowa aminokwasów - glicyna α N 2 C α COO R = Gly, G Wykład 1, 2006 6
Ogólna budowa aminokwasów - alanina α N 2 C α COO C 3 R = C 3 alfa- amiokwasy L - aminokwasy Ala, A L-aminokwasy - centrum asymetrii N 3 + R N 3 + C α C α COO - L D COO - Wykład 1, 2006 7
Reguła CORN R N 3 + C α L lewoskrętny (COO-R-N) COO - 20 aminokwasów białkowych kod 1- i 3- literowy alanina A, Ala arginina R, Arg asparagina N, Asn kw.asparaginowy D, Asp cysteina C, Cys glutamina Q, Gln kw.glutaminowy E, Glu glicyna G, Gly histydyna, is izoleucyna I, Ile leucyna L, Leu lizyna K, Lys metionina M, Met fenyloalanina F, Phe prolina P, Pro seryna S, Ser treonona T, Thr tryptofan W, Trp tyrozyna Y, Tyr walina V, Val Wykład 1, 2006 8
aminokwasy hydrofobowe/niepolarne A V L I P Y F W M C Ala Val Leu Ile Pro aromatyczne alifatyczne Tyr Phe Trp Cys Met zawierające siarkę aminokwasy hydrofilowe/polarne N Q S T K R D E N, Asn Q, Gln S, Ser T, Thr K, Lys naładowane (+) R, Arg, is D, Asp E, Glu naładowane (-) Wykład 1, 2006 9
Diagram Venn a b. małe Małe P Prolina Alifatyczne ydrofobowe I V L M Aromatyczne C S-S F Y W A G S N C S- T D E K R Q dodatnie Naładowane ujemne Polarne Specyficzne własności reszt aminokwasowych decydują o strukturze i aktywności biologicznej białek. cechy/kryteria: hydrofobowe/hydrofilowe alifatyczne aromatyczne, oddziaływujące warstwowo polarne-neutralne polarne naładowane dodatnio/ujemnie kwasowe, zasadowe C-β rozgałęzione małe/duże zawierające siarkę tworzące wiązania wodorowe wzmacniacze/łamacze struktur Wykład 1, 2006 10
Łańcuch polipeptydowy - struktura pierwszorzędowa struktura I-rzędowa: kolejność, sekwencja aminokwasów w łańcuchu (skład i kolejność kolejność decydują strukturze i funkcji) Ala Gly Thr Ile Val N 2 - AlaValGlySerThrLeuIle - COO Ser Leu N 2 - AVGSTLI - COO Wiązanie peptydowe wiązanie peptydowe + 3N C α C O O + + + 3N C α C O O + 2O O + 3N C α C N C α C O O + Wykład 1, 2006 11
a) Kierunkowość łańcucha, nazewnictwo b) R 1 + 3N C α C N C α O C N R 3 C α C N C α C O O R 2 O R 4 O + N- koniec C- koniec a) 4-Alanina lub tetra-alanina, b) tetrapeptyd o sekwencji R 1 R 2 R 3 R 4 Łańcuch aminokwasów: 2-10 oligopeptyd, 10-100 polipeptyd, powyżej 100 reszt aminokwasowych białko. Wiązanie peptydowe kąty walencyjne i długości wiązań R 2 O 1.23 Å N 3 + 121.1 o C 123.2 o 121.9 o C α C α 115.6 o N 119.5 o 118.2 o C R 1 119.5 o 1.0 Å O Wykład 1, 2006 12
Wiązanie peptydowe kąt torsyjny ω i konformacja Trans R 2 ω=180 o O N 3 + C C α C α N C R 1 O 0 o 180 o 90 o Wykład 1, 2006 13
Struktura drugorzędowa Przestrzenne ułożenie łańcucha opisane za pomocą kątów torsyjnychφ i ψ. ψ φ ω Elementy struktury II-rzędowej helisy: prawoskrętna α helisa 3 10 helisa π helisa helisa φ ψ ω reszt na skręt przesunięcie na resztę wiązania wodorowe α helisa -57-47 180 3,6 1,5 i+4 3 10 helisa -49-26 180 3,0 2,0 i+3 π helisa -57-70 180 4,4 1,2 i+5 Wykład 1, 2006 14
α - helisa α - helisa 3 10 - helisa π - helisa 22-reszty aminokwasowe Wykład 1, 2006 15
Elementy struktury II-rzędowej beta-harmonijki, (β-kartki, struktury pofałdowanej kartki): równoległe antyrównoległe mieszane harmonijka φ ψ ω reszt na skręt przesunięcie na resztę równoległa -139 135 180 2 3,2 antyrównoległa -119 113-175 2 3,4 β-harmonijki Wykład 1, 2006 16
Wykres Ramachandrana (Biochemistry, Jeremy Berg, John Tymoczko, Lubert Stryer. 5th ed,pwn 2005). Wykres Ramachandrana (Biochemistry, J.Berg, J.Tymoczko, L.Stryer.,PWN 2005). Wykład 1, 2006 17
Wykres Ramachandrana dla białka β-równoległa β-antyrównoległa α - helisa 3 10 - helisa π - helisa φ -119-139 -57-49 -57 ψ 113 135-47 -26-70 Łamacze i wzmacniacze Wzmacniacze Łamacze α - helisa M L E C A P G Y T S β - harmonijka równoległa V I F M L Y P G D E A N S K β - harmonijka antyrównoległa Q T R W C kłębek, zwrot G P D N S Y, naładowane Wykład 1, 2006 18
Wiązanie wodorowe δ - C O akceptor oddz. elektrostatyczne między dwoma względnie elektroujemnymi atomami energia: 4-13 kj/mol (energia wiązań kowalencyjnych: 418 kj/mol) δ + N donor δ -- δ + + δ -- N N N N O O O N N O O O Wiązania wodorowe dla β - harmonijki struktura równoległa struktura anty-równoległa Wykład 1, 2006 19
Wiązania wodorowe dlaα - helisy i i+4 Wiązania wodorowe dla zwrotu (skrętu) Wykład 1, 2006 20
Wiązanie wodorowe białko ligand Wiązanie wodorowe Wykład 1, 2006 21
Rodzaje oddziaływań stabilizujących strukturę oddziaływania wodorowe oddziaływania hydrofobowe oddziaływania van der Waalsa mostki dwu-siarczkowe mostki solne Oddziaływania hydrofobowe Zasady termodynamiki: układ ciepło otoczenie I. Energia otoczenia i układu jest stała II. W procesach spontanicznych entropia rośnie ( S>0) S - entropia - miara przypadkowości i nieuporządkowania - entalpia - zawartość ciepła w układzie(zwiększenie = wzrost entropii) S otoczenia = - układu /T G - energia swobodna (Gibbsa) G = układu -T S układu < 0 Reakcja zajdzie spontanicznie jeśli G < 0 Wykład 1, 2006 22
Oddziaływania hydrofobowe -spontaniczne zwijanie białek układ nieuporządkowany --duża entropia (S) (S) Oddziaływania hydrofobowe -spontaniczne zwijanie białek układ układ nieuporządkowany: --grupy grupy hydrofobowe porządkują cząsteczki wody wody --spadek entropii grupy hydrofilowe grupy hydrofobowe Wykład 1, 2006 23
Oddziaływania hydrofobowe -spontaniczne zwijanie białek układ układ uporządkowany (niższa entropia?): --grupy grupy hydrofobowe połączone --uwolnione cząsteczki wody wody są są nieuporządkowane --wzrost entropii grupy hydrofilowe grupy hydrofobowe Oddziaływania hydrofobowe -spontaniczne zwijanie białek układ układ uporządkowany (niższa entropia?): --grupy grupy hydrofobowe połączone --uwolnione cząsteczki wody wody są są nieuporządkowane --wzrost entropii S wody = - białka /T wzrost entropii wody kompensuje jej spadek związany ze zwijaniem białek! G = białka -T S białka < 0 grupy hydrofilowe grupy hydrofobowe Wykład 1, 2006 24
Rodzaje oddziaływań stabilizujących strukturę oddziaływania wodorowe oddziaływania hydrofobowe oddziaływania van der Waalsa mostki dwu-siarczkowe mostki solne Oddziaływania van der Waalsa ładunek - dipol dipol - dipol dyspersja (indukowane dipole) δ - δ + N + O C δ + δ - δ + C O C O δ + δ - δ + δ - C 3 3 C Wykład 1, 2006 25
Mostek dwu-siarczkowy --C 2 -S-S-C2-- sekwencja insuliny wołowej Struktura trzeciorzędowa przestrzenne ułożenie elementów struktury II-rzędowej pojedynczego łańcucha Wykład 1, 2006 26
Domeny, motywy, rodziny, superrodziny domeny - odrębne strukturalnie fragmenty białek domena wiążąca palca cynkowego Domeny, motywy, rodziny, superrodziny motywy strukturalne - struktury naddrugorzędowe:motyw all-α elisa -zwrot -helisa białka wiążące RNA 1rop.pdb 4 helisy (uteroglobin 1ccd.pdb) Wykład 1, 2006 27
Domeny, motywy, rodziny, superrodziny motywy strukturalne - struktury naddrugorzędowe:motyw all-β topologie beta-beczka (barrel) 1ifb.pdb Domeny, motywy, rodziny, superrodziny beta-helisa 2pec.pdb Wykład 1, 2006 28
Domeny, motywy, rodziny, superrodziny motywy strukturalne - struktury naddrugorzędowe:motywα-β-α-β α-β -beczka Rodziny, superrodziny czas Drzewo ewolucyjne globin. homologi: ortologi -różne gatunki, taka taka sama sama funkcja paralogi-podobna funkcja, ale ale ewoluowały niezależnie (ten (ten sam sam organizm) analogi: różne różne sekwencje, różne różne motywy, ale ale identyczna orientacja ważnych aminokwasów prymitywna, pierwotna globina wiążąca tlen Molecular Cell Biology,4ed. Lodish, Berk, Matsudaira, Kaiser, Krieger, Scott, Zipursky, and Darnell Wykład 1, 2006 29
krowa Rodzina - homologi Rybonukleaza wołowa (enzym trawienny) człowiek Rybonukleaza ludzka (enzym trawienny) angiogenina ludzka (stymuluje wzrost naczyń krwionośnych) (Biochemistry, J.Berg, J.Tymoczko, L.Stryer.,PWN 2005). Rodziny Wykład 1, 2006 30
Struktura czwartorzędowa Przestrzenne ułożenie dwóch lub więcej łańcuchów polipeptydowych tworzących natywną cząsteczkę białka białko Cro z bacteriofaga λ, jest dimerem złożonym z identycznych podjednostek Struktura VI-rzędowa dimer αβ hemoglobiny tetramer α 2 β 2 hemoglobiny (1G0B.pdb) Wykład 1, 2006 31
Struktura IV-rzędowa Ferytyna - 24mer (1BG7.pdb) Insulina (1AP.pdb) Oddziaływanie białek z ligandami Jądrowy receptor hormonu Grupy prostetyczne to często kofaktory Apoproteina - białko bez grupy prostetycznej Wykład 1, 2006 32
Wykład 1, 2006 33