Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl
Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecnośd
Literatura, materiały i ewolucja molekularna Paul G. Higgs, Teresa K. Attwood. Podręcznik do analizy genów i białek A.D. Baxevanis (red.), B.F.F. Ouellette (red.) http://www.bioinformatyk.eu/
Definicja interdyscyplinarna dziedzina nauki obejmująca wykorzystanie metod obliczeniowych do badania danych biologicznych. Rozwój metod obliczeniowych służących do badania struktury, funkcji i ewolucji genów, białek i całych genomów Rozwój metod wykorzystywanych do zarządzania i analizy informacji biologicznej gromadzonej w toku badao genomicznych oraz badao prowadzonych z zastosowaniem wysokoprzepustowych technik eksperymentalnych.
Nie mylid z pojęciem: Algorytmy genetyczne (jest to grupa metod inteligencji obliczeniowej, które w swoim działaniu wzorują się na mechanizmach ewolucji).
Cele bioinformatyki Obsługa rosnących baz danych biologicznych Wyszukiwanie informacji w bazach danych biologicznych (również bazach publikacji) Analiza, dopasowanie sekwencji nukleotydów Lokalizacja genów Przewidywanie struktury i funkcji białek na podstawie sekwencji Analiza ekspresji genów (analiza mikromacierzy) Projektowanie leków Ewolucja molekularna Biologia systemowa (ang. System biology) - badanie złożonych oddziaływao występujących w systemach biologicznych
Zakres przedmiotu Rys historyczny Biologiczne bazy danych Analiza sekwencji Metody grupowania danych Konstrukcja drzew filogenetycznych Wykorzystanie języków programowania Python/ R (?)
Bioinformatics vs. Computational Biology Bioinformatyk biolog wykorzystujący metody obliczeniowe do rozwiązania problemów biologicznych Computational biologists opracowuje teorie, metody, algorytmy na potrzeby bioinformatyki
Ewolucja różnicowanie się materiału genetycznego Ewolucja molekularna porównawcze analizy na poziomie molekularnym między gatunkami Genetyka populacyjna badanie zróżnicowania genetycznego u osobników tego samego gatunku
Rys historyczny 1982 Utworzenie bazy GeneBank 1986 - Projekt poznania genomu ludzkiego 2000 Ukooczenie prac nad ogólną sekwencją - Eksplozja danych ->
Rys historyczny
Zależnośd wykładnicza Zależnośd liniową widoczną na wykresach otrzymujemy przez wzięcie logarytmu obu stron równania
Bazy danych
Bazy danych
Cztery główne rodzaje danych w bioinformatyce
Genomika dziedzina biologii molekularnej i biologii teoretycznej (pokrewna genetyce i ściśle związana z bioinformatyką) zajmująca się analizą genomu organizmów. Głównym celem genomiki jest poznanie sekwencji materiału genetycznego oraz mapowanie genomu ale również określenie wszelkich zależności i interakcji wewnątrz genomu.
DNA kwas deoksyrybonukleinowy RNA kwas rybonukleinowy Zasady azotowe Adenina (A) Tymina (T) Guanina (G) Cytozyna (C) Uracyl (U) (zastępuje tyminę w RNA) Parowanie C-G A-T
fosfocukrowy szkielet cząsteczki RNA
Podstawową jednostką budulcową kwasów nukleinowych są nukleotydy. Nukleotyd = cząsteczka zasady azotowej+cukier (ryboza)+reszta fosforanowa Nukleotydy występują nie tylko w formie łaocuchów.
Szkielet cząsteczki białka W ramkach zaznaczone wiązania peptydowe.
Aminokwasy Kwas asparginowy Kwas glutaminowy Tryptofan Fenyloalanina Glicyna Alanina Walina Izoleucyna Leucyna Metionina Prolina Lizyna Arginina Histydyna Tyrozyna Seryna Treonina Asparagina Glutamina Cysteina
Analiza podobieostwa aminokwasów za pomocą metod grupowania hierarchicznego
Centralny Dogmat Biologii Molekularnej DNA RNA Białka transkrypcja translacja
Kod genetyczny jak sekwencje nukleotydów przekładają się na sekwencje aminokwasów Tłumaczeniu podlegają trójki nukleotydów, tzw. kodony Kodonów (64) jest więcej niż aminokwasów (20). Większości aminokwasów odpowiada więcej niż jeden kodon.
Jednym z celi jest przewidywanie struktury i właściwości białek - struktura drugo-, trzeciorzędowa białek Proteomika gałąź nauki zajmująca się badaniem białek - ich struktury, sprawowanych przez nie funkcji i zależności między nimi.
Poziomy organizacji białek Struktura pierwszorzędowa Struktura drugorzędowa Struktura trzeciorzędowa Struktura czwartorzędowa
Poziomy organizacji białek Struktura pierwszorzędowa Liniowy układ aminokwasów w łaocuchu polipeptydowym (jednowymiarowa sekwencja 20 znaków) np. insulina 51 aminokwasów
Poziomy organizacji białek Struktura drugorzędowa Opisuje przestrzenne uporządkowanie łancuchów polipeptydowych białek (skutek wiązao wodorowych) Helisy alfa Harmonijka beta Beta zakręt (petle omega)
Poziomy organizacji białek Struktura trzeciorzędowa Określa wzajemny przestrzenny układ elementow struktury drugorzędowej Decyduje o aktywności biochemicznej białka Wiązania odpowiedzialne za tę strukturę są dośd słabe Denaturacja zniszczenie struktury przez np. temperaturę powyżej 40 45 st. C Spora częśd białek nie ma stabilnej struktury trzeciorzędowej
Poziomy organizacji białek Struktura czwartorzędowa Tworzy ją tylko częśd białek Określa wzajemny przestrzenny układ oraz sposób łącznia Podjednostek (osobnych łaocuchów polipeptydowych) niepołączonych kowalencyjnie Grup prostetycznych (niebiałkowe składniki białek np. cukry, lipidy, jony metali)
Poziomy organizacji białek Struktura czwartorzędowa Model wstęgowy hemoglobiny
Dopasowanie sekwencji
Drzewo filogenetyczne (drzewo rodowe) graf acykliczny przedstawiający ewolucyjne zależności pomiędzy sekwencjami lub gatunkami wszystkich organizmów żywych(analogicznie do pokrewieostwa w rodzie ludzkim zobrazowanym przez drzewo genealogiczne). Jest to rodzaj dendrogramu, w którym podstawa (pieo) drzewa filogenetycznego symbolizuje wspólnego przodka taksonów znajdujących się wyżej (czyli bardziej współczesnych i wyżej stojących ewolucyjnie), konary odpowiadają taksonom potomnym; długośd gałęzi, a czasem również kąt pomiędzy nimi, określają tempo zachodzących przemian ewolucyjnych.