Spis treści 5 Budowa kwasów nukleinowych... 68 5.1 Nukleotydy... 68 5.2 Łaocuch polinukleotydowy... 71 5.3 Nić komplementarna... 71 6 Centralny dogmat Biologii Molekularnej... 74 7 Przepływ informacji genetycznej... 76 7.1 Kod genetyczny... 77 7.2 Rodzaje Mutacji... 80 7.3 Poziomy mutacji... 81 Skrypt Bioinformatyka DRAFT Strona 67
5 Budowa kwasów nukleinowych 5.1 Nukleotydy Kwasy nukleinowe (DNA i RNA) zbudowane są z nukleotydów. Nukleotydy zbudowane są z reszty cukrowej, zasady azotowej i reszty fosforanowej. Reszta cukrowa występująca w kwasach nukleinowych to pentoza: w DNA - deoksyryboza, która w pozycji 2 ma wodór zamiast grupy -O (D-Deoksyryboza, 2-Deoksy-D-ryboza), a w RNA - ryboza. (Rysunek) O 4' C 5' O O 1' O 4' C 5' O O 1' 3' O 2' O 3' O 2' Rysunek. Ryboza i deoksyryboza. Zasady azotowe występujące w kwasach nukleinowych to puryny (R): adenina (A) i guanina (G), oraz pirymidyny (Y): tymina (T), cytozyna (C) i uracyl (U). W DNA występują A, G, T i C, w RNA zamiast T występuje U. Poza tymi pięcioma najbardziej znanymi zasadami w DNA i RNA występują jeszcze ich zmodyfikowane wersje. W DNA: 5-metylocytydyna (m5c), a RNA: pseudourydyna (Ψ), dihydrourydyna (D), inosyna (I), rybotymidyna (rt) i 7-metylguanosyna (m7g). Skrypt Bioinformatyka DRAFT Strona 68
puryny (R) pirymidyny (Y) N 7 8 9 N 5 4 6 3 N 1 2 N 5 4 6 1 N 3 2 N adenina (A) guanina (G) tymina (T) cytozyna (C) uracyl (U) Nukleozydy powstają w wyniku połączenia zasady azotowej z pentozą (węgiel C1) wiązaniem N-βglikozydowym. Zasady połączone z rybozą tworzą rybonukleozydy, a z deoksyrybozą - deoksyrybonukleozydy. da dg dt dc ra rg ru rc Skrypt Bioinformatyka DRAFT Strona 69
Reszta fosforanowa to reszta kwasu ortofosforowego, czyli nukleotydy są jego estrami: 5'-fosforany nukleozydów. 5'adenozyno monofosforan (AMP) : deoksy 5'adenozyno monofosforan (damp) : Skrypt Bioinformatyka DRAFT Strona 70
5.2 Łańcuch polinukleotydowy Nukleotydy łączą się wiązaniem fosfodiestrowym tworząc łańcuchy polinukleotydowe (DNA lub RNA) (rysunek: http://en.wikipedia.org/wiki/file:phosphodiesterbonddiagram.png) [...] 5' i 3' koniec łańcucha więcej o nici DNA [...cdn] v 5.3 Nić komplementarna Skrypt Bioinformatyka DRAFT Strona 71
[...] wiązania wodorowe między nukleotydami, pary komplementarne, nić komplementarna [...] DNA i RNA - jedno i dwuniciowe, różne formy helis DNA Skrypt Bioinformatyka DRAFT Strona 72
(Rysunek: http://en.wikipedia.org/wiki/file:a-dna,_b-dna_and_z-dna.png) A-DNA, B-DNA, Z-DNA Skrypt Bioinformatyka DRAFT Strona 73
6 Centralny dogmat Biologii Molekularnej informacja genetyczna przechowywana jest w sekwencji zasad polimeru DNA trójki (tryplety) zasad DNA kodują 20 naturalnych aminokwasów sekwencja aminokwasów w białku determinuje jego strukturę sekwencja i struktura determinują funkcję Bioinformatyka Skrypt Bioinformatyka DRAFT Strona 74
Złożoność informacji i procesów komórkowych Człowiek posiada 10 13 KOMÓREK! każda ma identyczny skład DNA o długości około 3,2x10 9 pz... identyczny skład, ale zróżnicowane typy komórek i różne funkcje tkanek... z 3,2x10 9 pz tylko 1.5% koduje białka! Wielkość genomu nie koreluje się ze złożonością organizmu wśród bezkręgowców i kręgowców można znaleźć większe genomy od ludzkiego - jeden z gatunków ameby ma aż 100x więcej DNA niż człowiek - na ogół genomy prokariotyczne są mniejsze od eukariotycznych - genom prokariotyczny ma wielkość poniżej 5Mpz (np. Escherichia coli 4,64 Mpz) Gen/Genom Skrypt Bioinformatyka DRAFT Strona 75
GENOM... 7 Przepływ informacji genetycznej Skrypt Bioinformatyka DRAFT Strona 76
7.1 Kod genetyczny -translacja Otwarte ramki odczytu (ORF) otwarte ramki odczytu ORF (Open Reading Frame). wszystkie możliwe sekwencje DNA rozpoczynające się kodonem ATG (kodon inicjujący translację) i kończące TAG, TAA lub TGA (kodony stop ) w tej samej fazie odczytu. Skrypt Bioinformatyka DRAFT Strona 77
1' sekwencja czytana od pierwszego nukleotydu: +1, pierwsza ramka odczytu 2' sekwencja czytana od drugiego nukleotydu: +2, druga ramka odczytu 3' sekwencja czytana od trzeciego nukleotydu: +3, trzecia ramka odczytu sekwencja nici komplementarnej czytana od pierwszego nukleotydu: -1, czwarta ramka odczytu sekwencja nici komplementarnej czytana od drugiego nukleotydu: -2, piąta ramka odczytu sekwencja nici komplementarnej czytana od trzeciego nukleotydu: -3, szósta ramka odczytu Skrypt Bioinformatyka DRAFT Strona 78
Skrypt Bioinformatyka DRAFT Strona 79
7.2 Rodzaje Mutacji J.T. den Dunnen, S.E. Antonarakis: um Genet 109(1): 121-124, 2001 Zmienność sekwencji (sequence variation) mutacje - zmiany odpowiedzialne za choroby polimorfizm - zmiany nie wywołujące chorób, spotykane w częściej niż w 1% populacji Rodzaje mutacji chromosomowa - aberracja chromosomowa to zmiana liczby lub struktury chromosomów. genomowa - utrata lub pojawienie się dodatkowych pojedynczych chromosomów, lub zwielokrotnieniu całego genomu (poliploidalność) genowa - zmiana dziedziczna zachodząca w genie, na poziomie kwasu dezoksyrybonukleinowego DNA Skrypt Bioinformatyka DRAFT Strona 80
7.3 Poziomy mutacji Opis zmian powinien być dokonywany na najbardziej podstawowym poziomie. Np. w przypadku DNA na sekwencji genomowej lub cdna Zmiany opisuje się względem sekwencji pierwotnej zdeponowanej w bazie danych: GenBank, EMBL, DDJB, SWISS-Prot. Poziomy: DNA RNA Białko. Mutacje DNA Substytucja Substytucja (zamiana) oznaczana przez > 76A > C nukleotyd 76A zamieniony na C 88+1G > T (IVS2 +1G > T) G zamieniony na T w +1 intronu 2, pozycja 88-89 w odniesieniu do cdna (+1 : ATG kodon inicjujący translacje, -1: brak zasady 0) Delecja Delecja (deletion) del za nukleotydem oznaczającym delecje 76_78del (76_78delACT) oznacza usunięcieact zmiejsca 76 to 78 82_83del (82_83delTG) oznacza usunięcie TG z sekwencji ACTTTGTGCC (G jest 82 nukleotydem) wynik: ACTTTGCC Insercja Insercja (insertions) ins między nukleotydami, oznaczającymi miejsce wstawienia. (uwaga: czasami dodaje się "^"- np. 83^84insTG) 76_77insT oznacza wstawienie T między nukleotydami 76 a 77 83_84insTG oznacza wstawienie TG do sekwencji powtórzeń tandemu TG ACTTTGTGCC (G jest 83 nukleotydem) ACTTTGTGTGCC. insercja/delecja Skrypt Bioinformatyka DRAFT Strona 81
insertion/deletions (indels) delecja/insercja (delins) delecja, po której następuje insercja 112_117delinsTG lub 112_117delAGGTCAinsTG lub 112_117>TG oznacza zastąpienie nukleotydów 112 to 117 (AGGTCA) przez TG Powtórzenia Powtórzenia krótkiej sekwencji (variability of short sequence repeats), np..: ACTGTGTGCC (A jest 1991 nukleotydem) 1993(TG)3-6 sekwencja zawiera od miejsca 1993 TG-dwunukleotyd, który powtarza się w populacji 3-6 razy Duplikacje duplikacje (duplications) oznaczane przez dup ponukleotydzie oznaczajacym miejsce duplikacji 77_79dupCTG nukleotydy 77 do 79 są powielone 82_83dupTG (lub 83_84insTG) (short tandem repeats lub single nucleotide stretches) insercja TG do sekwencji powtórzeń tandemu TG: ACTTTGTGCC (A jest 76 nukleotydem) ACTTTGTGTGCC Inwersja Inwersja (inversions) oznaczana inv za nukleotydem oznaczającym miejsce rozpoczęcia inwersji. - obrócenie sekwencji o 180 o 203_506inv ( 203_506inv304) znacza, że 304 nukleotydy od 203 do 506 zostały odwrócone Inne mutacje DNA: translokacja zmienność w obrębie różnych alleli (choroby recesywne): o [zmiany w 1] + [zmiany w 2] zmienność w obrębie tego samego allela o [zmiana 1;2;3] Skrypt Bioinformatyka DRAFT Strona 82
Allel jest to jedna z wersji genu w określonym locus na danym chromosomie homologicznym. Mutacje białka Substytucja (zamiana, mutacje punktowe) cicha zamiana nukleotydów nie powodująca zmian w sekwencji aminokwasowej błędna (missense) W26C zamiana 26-tego tryptofanu na cysteine nonsensowna (nonsense) W26X zamiana 26-tego tryptofanu na kodon STOP p.? lub p.0 początkowa metionina (initiating Methionine M1) zaminiona np. na V (M1V - niepoprawnie oznaczeni), - nie powstaje żadne białko Delecja Delecja oznaczana przez del K29del w sekwencji CKMGQQQCC (C jest 28 ak) (usunięcie 29 lizyny) CMGQQQCC Q35del w sekwencji CKMGQQQCC (C jest 28 ak) CKMGQQCC C28_M30del usunięcie 3 aminokwasów od Cysteiny 28 do Metioniny 30 Duplikacja Duplikacja oznaczana przez dup G31_Q22dup w sekwencji CKMGQQQCC (C jest 28 ak) (duplikacja od G31 doq33) CKMGQGQQQCC 34_Q35dup CKMGQQCC (C jest 28 ak) CKMGQQQCC (lub insercja duplikująca tandem Q: Q35_C36insQ) Insercja Insercja oznaczana przez ins (uwaga czasami używany jest separator ^ : Q83^C84insQ) K29_M29insQSK wstawienie sekwencji QSK między Lyzynę 29 (K) and Metioninę 30 (M) CKMGQQQCC CKQSKMGQQQCC Q35_C36insQ : CKMGQQQCC CKMGQQQQCC (lub insercja duplikująca Q35dup) Skrypt Bioinformatyka DRAFT Strona 83
Insercja/delecja Insertion/deletions (indels) delecja trójki nukleotydów, po której nastapiła insercja inne trójki: C28_K29delinsW delecja dwóch trójek nukleotydów kodujących Cysteine 28 i Lysine 29, zastąpionych kodonem tryptofanu C28delinsWV usunięcie trójki nukleotydów kodujących cysteinę i wstawienie kodonów Tryptofanu (W) i waliny (V) Przesunięcie ramki frame shifting mutations: fs R97fsX121 (lub R97fs) przesunięcie ramki odczytu, zmieniające argininę (R97) w pierwszy amiokwas nowej ramki zakończonej po 23 aminokwasach (X121)= kodon STOP w pozycji 121 łańcucha białkowego. Skrypt Bioinformatyka DRAFT Strona 84