Zadania bioinformatyki

Podobne dokumenty
Historia Bioinformatyki

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

Bioinformatyka Laboratorium, 30h. Michał Bereta

PODSTAWY BIOINFORMATYKI

Bioinformatyka Laboratorium, 30h. Michał Bereta

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Wprowadzenie do biologii molekularnej.

Bioinformatyka Laboratorium, 30h. Michał Bereta

6. Z pięciowęglowego cukru prostego, zasady azotowej i reszty kwasu fosforowego, jest zbudowany A. nukleotyd. B. aminokwas. C. enzym. D. wielocukier.

Dr. habil. Anna Salek International Bio-Consulting 1 Germany

Geny i działania na nich

Wykład 14 Biosynteza białek

Podstawy biologiczne - komórki. Podstawy biologiczne - cząsteczki. Model komórki eukariotycznej. Wprowadzenie do Informatyki Biomedycznej

1. Na podanej sekwencji przeprowadź proces replikacji, oraz do obu nici proces transkrypcji i translacji, podaj zapis antykodonów.

Jajko czy kura? czyli gdzie dwóch się bije, tam trzeci korzysta

SCENARIUSZ LEKCJI BIOLOGII Z WYKORZYSTANIEM FILMU Transkrypcja RNA

Scenariusz lekcji przyrody/biologii (2 jednostki lekcyjne)

Jak działają geny. Podstawy biologii molekularnej genu

KARTA PRZEDMIOTU. (pieczęć wydziału)

Wykład 1. Od atomów do komórek

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

WYKŁAD: Klasyczny przepływ informacji ( Dogmat) Klasyczny przepływ informacji. Ekspresja genów realizacja informacji zawartej w genach

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19

Bioinformatyczne bazy danych

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

Nowoczesne systemy ekspresji genów

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Algorytmika dla bioinformatyki

Scenariusz lekcji biologii z wykorzystaniem metody CILIL Lekcja dla klasy IV technikum o rozszerzonym zakresie kształcenia

Podstawy biologii. Podstawy biologii molekularnej

Pamiętając o komplementarności zasad azotowych, dopisz sekwencję nukleotydów brakującej nici DNA. A C C G T G C C A A T C G A...

BIOLOGICZNE BAZY DANYCH SYLABUS

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Wybrane techniki badania białek -proteomika funkcjonalna

Bioinformatyczne bazy danych

Informatyka w medycynie Punkt widzenia kardiologa

Podstawy genetyki molekularnej

Bioinformatyka. Michał Przyłuski

Kontakt.

Wykład 12 Kwasy nukleinowe: budowa, synteza i ich rola w syntezie białek

WARUNKI ZALICZENIA PRZEDMIOTU- 5 ECTS

DNA superhelikalny eukariota DNA kolisty bakterie plazmidy mitochondria DNA liniowy wirusy otrzymywany in vitro

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (1)

Budowa kwasów nukleinowych

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA

Zaoczne Liceum Ogólnokształcące Pegaz

Biologiczne podstawy ewolucji. Informacja genetyczna. Co to jest ewolucja.

Generator testów Bioinformatyka wer / 0 Strona: 1

TATA box. Enhancery. CGCG ekson intron ekson intron ekson CZĘŚĆ KODUJĄCA GENU TERMINATOR. Elementy regulatorowe

CORAZ BLIŻEJ ISTOTY ŻYCIA WERSJA A. imię i nazwisko :. klasa :.. ilość punktów :.

Numer pytania Numer pytania

Translacja i proteom komórki

przedmiotu Nazwa Wydział Nauk Medycznych i Nauk o Zdrowiu Kierunek jednolite studia magisterskie Profil kształcenia (studiów)

WPROWADZENIE DO GENETYKI MOLEKULARNEJ

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Projektowanie molekularne i bioinformatyka. 2-letnie studia II stopnia (magisterskie)

Dane mikromacierzowe. Mateusz Markowicz Marta Stańska

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2)

Dominika Stelmach Gr. 10B2

Kwasy Nukleinowe. Rys. 1 Struktura typowego dinukleotydu

Kombinatoryczna analiza widm 2D-NOESY w spektroskopii Magnetycznego Rezonansu Jądrowego cząsteczek RNA. Marta Szachniuk

Chemiczne składniki komórek

Ekspresja informacji genetycznej

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

DNA - niezwykła cząsteczka. Tuesday, 21 May 2013

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

DNA musi współdziałać z białkami!

Wzorcowe efekty kształcenia dla kierunku studiów biotechnologia studia pierwszego stopnia profil ogólnoakademicki

TRANSKRYPCJA - I etap ekspresji genów

Mikrosatelitarne sekwencje DNA

Informacje dotyczące pracy kontrolnej

BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH

Wprowadzenie. DNA i białka. W uproszczeniu: program działania żywego organizmu zapisany jest w nici DNA i wykonuje się na maszynie białkowej.

Wybrane techniki badania białek -proteomika funkcjonalna

Rozkład materiału z biologii dla klasy III AD. 7 godz / tyg rok szkolny 2016/17

Od jakiego pułapu startujemy? matematyka

Bioinformatyka. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2010/2011. Krzysztof Pawłowski

Nośnikiem informacji genetycznej są bardzo długie cząsteczki DNA, w których jest ona zakodowana w liniowej sekwencji nukleotydów A, T, G i C

Generator testów Bioinformatyka_zdalne wer / 0 Strona: 1

Specjalność (studia II stopnia) Oczyszczanie i analiza produktów biotechnologicznych

Podstawy biologii. Informacja, struktura i metabolizm.

Wymagania edukacyjne

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Porównywanie i dopasowywanie sekwencji

Scenariusz lekcji biologii dla klasy 8 SP, 1 liceum poziom podstawowy. Temat: DNA nośnik informacji dziedzicznej. Przepływ informacji genetycznej.

Kierunek Informatyka stosowana Studia stacjonarne Studia pierwszego stopnia

Wykład: 2 JĄDRO KOMÓRKOWE I ORGANIZACJA CHROMATYNY. Jądro komórkowe. Prof. hab. n. med. Małgorzata Milkiewicz Zakład Biologii Medycznej.

WPROWADZENIE DO GENETYKI MOLEKULARNEJ

Biologia medyczna, materiały dla studentów

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Podstawy bioinformatyki - biologiczne bazy danych

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Bioinformatyczne bazy danych

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

TEORIA KOMÓRKI (dlaczego istnieją osobniki?)

Transkrypt:

BIOINFORMATYKA edycja 2016 / 2017 wykład 1 Zadania bioinformatyki dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net

Bioinformatyka w praktyce IIMK UJ Bioinformatyka, wykład 1 slajd 2 Jacek Śmietański, Kraków 2016

Główne obszary zastosowań Medycyna np. medycyna personalizowana Farmaceutyka np. projektowanie leków Kryminalistyka np. identyfikacja sprawców Sądownictwo np. ustalanie ojcostwa Rolnictwo np. tworzenie nowych odmian Archeologia np. badania paleontologiczne slajd 3 Jacek Śmietański, Kraków 2016

Zagadnienia powiązane Zarządzanie dużą ilością danych (Big Data) Eksploracja danych (Data Mining) Uczenie maszynowe (Machine Learning) Teoria grafów (Graph Theory) Problemy optymalizacyjne Algorytmika Programowanie slajd 4 Jacek Śmietański, Kraków 2016

Bioinformatyka wśród innych nauk slajd 5 Jacek Śmietański, Kraków 2016

Czym zajmuje się bioinformatyka? Intuicja: wykorzystanie komputerów w badaniach biologicznych. slajd 6 Jacek Śmietański, Kraków 2016

Różne ujęcia slajd 7 Jacek Śmietański, Kraków 2016

Formalna definicja NIH (Narodowego Instytutu Zdrowia, USA) Research, development, or application of computational tools and approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data. Definicja bardzo obszerna (obejmuje praktycznie wszystkie nauki o życiu). Nie jest to jedyna istniejąca definicja. Nie ma jednoznacznego, precyzyjnego określenia zakresu bioinformatyki. Pamiętajmy też, że jest to nauka bardzo dynamicznie się rozwijająca, co za tym idzie, zakres badań też może się zmieniać. Wielu badaczy, mówiąc o bioinformatyce, ma na myśli głównie aspekty związane z biologią na poziomie molekularnym (DNA, RNA, białko). Osobiście uznaję definicję NIH, ale ten przedmiot koncentrował się będzie wyłącznie na aspektach molekularnych. slajd 8 Jacek Śmietański, Kraków 2016

Bioinformatyka a biologia obliczeniowa Często pojęcia te są utożsamiane ze sobą. Z kolei źródła dokonujące rozróżnienia często robią to w zgoła odmienny sposób. Np. wg Harper's Illustrated Biochemistry : Bioinformatyka to zbieranie i wykorzystywanie istniejących danych, natomiast istotą biologii obliczeniowej jest wykorzystanie mocy obliczeniowej w eksperymentach biologicznych. W podręczniku Xionga: Bioinformatyka różni się od powiązanej z nią dziedziny zwanej biologią obliczeniową, gdyż ogranicza się do analizy sekwencji, struktury oraz funkcji genów i genomów oraz odpowiadających im produktów ekspresji. Dlatego często określa się ją mianem molekularnej biologii obliczeniowej. Biologia obliczeniowa natomiast obejmuje wszystkie obszary biologii, które wymagają obliczeń. Na przykład w modelowaniu matematycznym ekosystemów i dynamiki populacji, w zastosowaniu teorii gier do analiz behawioralnych i rekonstrukcjach filogenetycznych wykorzystujących dane kopalne stosuje się narzędzia obliczeniowe, które nie muszą mieć związku z makrocząsteczkami biologicznymi. slajd 9 Jacek Śmietański, Kraków 2016

Bioinformatyka a biologia obliczeniowa (2) Biologia obliczeniowa Przetwarzanie danych wcale nie musi być trudne pojęciowo i algorytmicznie skomplikowane wymaga jednak wykonania wielu obliczeń (dlatego przymiotnik obliczeniowa ). Zajęcie mało twórcze, wręcz mechaniczne. Bioinformatyka Wykorzystuje często zaawansowane techniki i algorytmy opracowane w ramach rozwoju informatyki. W wielu zadaniach wymaga indywidualnego podejścia do problemu i dedykowanych algorytmów. Jeszcze jedna opinia: biologia obliczeniowa zajmuje się poznaniem tego co jest, natomiast bioinformatyka tworzeniem tego, czego jeszcze nie ma W temacie istoty bioinformatyki polecam też wykład prof Jacka Błażewicza pt. Bioinformatyka i jej perspektywy : http://www2.cs.put.poznan.pl/wp-content/uploads/2011/11/wyklad_inauguracyjny_2011.pdf slajd 10 Jacek Śmietański, Kraków 2016

Rozpoznawanie obrazów? a) obraz medyczny na poziomie tkankowym (tu: tomografia) b) obraz medyczny na poziomie komórkowym (mikroskopowy) c) obraz biologiczny (mikroskopowy) Zgodnie definicją NIH tak, to wchodzi w zakres bioinformatyki. Ale wielu bioinformatyków nie uwzględnia tego obszaru. Na tym wykładzie zagadnienia związane z analizą obrazów zostaną* pominięte. * Do analizy obrazów wrócimy na chwilę podczas omawiania metod analizy mikromacierzy, są to jednak stosunkowo proste zagadnienia (w porównaniu z przykładami powyżej), a z drugiej strony nie będziemy wnikali w szczegóły stosowanych tam algorytmów. slajd 11 Jacek Śmietański, Kraków 2016

Rozwój bioinformatyki (1) 1859 Charles Darwin Podstawy teorii ewolucji: publikacja pracy O powstawaniu gatunków drogą naturalnego doboru czyli o utrzymywaniu się doskonalszych ras w walce o byt ( On the Origin of Species by Means of Natural Selection, or the Preservation of Favoured Races in the Struggle for Life ) slajd 12 Jacek Śmietański, Kraków 2016

Rozwój bioinformatyki (2) 1865 Mendel eksperymentując z grochem, wykazuje, że cechy dziedziczą się w odrębnych jednostkach; 1869 Meischer wyizolował DNA; 1895 Rőntgen okrywa promienie X; 1902 Sutton proponuje chromosomową teorię dziedziczności; 1911 Morgan z współpracownikami stabilizuje tą teorię, badając muszkę owocówkę; 1943 Astbury obserwuje wzór DNA przy użyciu promieni X; 1944 - Avery, MacLeod i McCarty wykazują, że DNA przenosi cechy dziedziczne (nie białka!) slajd 13 Jacek Śmietański, Kraków 2016

Rozwój bioinformatyki (3) 1951 - Pauling and Corey przewidują strukturę II-rzędową białek (α-helisę i β-kartkę) (Proc. Natl. Acad. Sci. USA, 27: 205-211, 1951; Proc. Natl. Acad. Sci. USA, 37: 729-740, 1951); 1953 Watson i Crick proponują model podwójnej helisy DNA, bazując na badaniach krystalograficznych Franklin i Wilkins (Nature, 171: 737-738, 1953); 1955 Sanger przedstawia pierwszą sekwencję białkową (insulina bydlęca); 1955 Kornberg izoluje enzym polimerazę DNA; 1958 powstaje pierwszy układ scalony w korporacji Texas Instruments; slajd 14 Jacek Śmietański, Kraków 2016

Rozwój bioinformatyki (4) 1959 - Perutz i Kendrew otrzymują pierwszą strukturę krystalograficzną białka (hemoglobina i mioglobina); 1961 Brenner, Jacob i Meselson odkrywają mrna przekazujące informację z DNA jądra do cytoplazmy; 1965 Dayhoff atlas sekwencji i struktur białkowych; 1965 Nirenberg, Khorana, Ochoa i inni łamią kod genetyczny; 1970 powstaje algorytm do porównywania sekwencji (Needleman-Wunsch); 1972 Berg ze współpracownikami tworzą pierwszą rekombinowaną molekułę DNA; 1973 Cohen odkrywa klonowanie DNA; 1975 Sanger i inni (Maxam, Gilbert) opracowują metody sekwencjonowania; slajd 15 Jacek Śmietański, Kraków 2016

Rozwój bioinformatyki (5) 1977 - pierwsza kompletna sekwencja genu (bakteriofag FX174) 5386 zasad; 1981 algorytm Smith-Waterman; 1981 IBM wprowadza komputer osobisty na rynek; 1982 powstaje baza danych GenBank; 1982 zsekwencjonowano genom faga lambda; 1983 algorytm poszukiwania sekwencji (Wilbur- Lipman); 1983 Mullins odkrywa reakcję PCR; 1985 - Lipman i Pearson odkrywają algorytm FASTP; 1986 utworzenie bazy SWISS-PROT; 1986 ogłoszono The Human Genome Initiative; 1988 Lipman i Pearson algorytm FASTA; slajd 16 Jacek Śmietański, Kraków 2016

Rozwój bioinformatyki (6) 1988 powstaje National Center for Biotechnology Information (NCBI) 1990 powstaje program BLAST; 1990 oficjalnie startuje Human Genome Project; 1991 instytut badawczy CERN w Genewie zapowiada powstanie protokołów, które utworzą sieć World Wide Web (Berners-Lee); 1991 - opisano utworzenie i użycie sekwencji EST; 1992 - The Institute for Genomic Research (TIGR) utworzony przez Ventra w Rockville; 1994 EMBL European Bioinformatics Institute, Hinxton, UK; slajd 17 Jacek Śmietański, Kraków 2016

Rozwój bioinformatyki (7) 1995 pierwszy genom bakteryjny (Haemophilus influenzea) zostaje zsekwencjonowany (1.8 Mb); 1996 Affymetrix produkuje pierwszą komercyjną mikromacierz DNA; 1996 zsekwencjonowanie genomu drożdży (pierwszy kompletny genom eukariotyczny); 1997 opublikowano algorytm PSI-BLAST; 1997 genom E.coli zsekwencjonowany (4,6 Mb); 1998 genom C. elegans zsekwencjonowany (pierwszy kompletny genom organizmu wielokomórkowego, 97 Mb); 1998 - Venter zakłada Celera w Rockville; 1998 - The Swiss Institute of Bioinformatics powstaje w Genewie; slajd 18 Jacek Śmietański, Kraków 2016

Rozwój bioinformatyki (8) 1999 pierwszy kompletny chromosom ludzki (HGP); 2000 genom Drosophila melanogaster kompletny; 2000 chromosom 21 kompletny; 2001 opublikowanie sekwencji genomu ludzkiego (3,000 Mb); 2003 genom ludzki kompletny; 2007 Human Metabolome Project 2008 startuje European Genotype Archive 2010 mapa ekspresji genów ludzkich 2012 1000 Genomes Project 2014 startuje Elixir slajd 19 Jacek Śmietański, Kraków 2016

Układ okresowy bioinformatyki (rozwój oprogramowania) Układ przedstawia narzędzia bioinformatyczne pogrupowane wg klucza tematycznego. Warto zajrzeć na stronę źródłową, gdzie jest symulacja dynamiki rozwoju tych narzędzi oraz szereg dodatkowych informacji. http://elements.eaglegenomics.com slajd 20 Jacek Śmietański, Kraków 2016

Bioinformatyka II UJ: organizacja przedmiotu slajd 21 Jacek Śmietański, Kraków 2016

Harmonogram wykładów 1. (5.10) Wprowadzenie do bioinformatyki 2. (19.10) Bioinformatyczne bazy danych 3. (2.11) Globalne dopasowanie par sekwencji 4. (9.11) Lokalne dopasowanie par sekwencji, istotność statystyczna 5. (16.11) Przeszukiwanie baz sekwencyjnych (BLAST), dopasowania wielosekwencyjne 6. (23.11) Analizy filogenetyczne 7. (30.11) Sekwencjonowanie DNA, składanie genów i genomów 8. (7.12) RNA 9. (14.12) Transkryptomika; eksperymenty mikromacierzowe 10. (21.12) Aminokwasy i białka, struktury drugorzędowe 11. (4.01) Przewidywanie struktur przestrzennych białek 12. (11.01) Przewidywanie interakcji, dokowanie, modelowanie sieci 13. (18.01) Projektowanie leków i medycyna personalizowana 14. (25.01) Uczenie maszynowe w bioinformatyce, CUDA slajd 22 Jacek Śmietański, Kraków 2016

Zasady zaliczenia 50+ pkt laboratoria 50 pkt projekt Laboratoria: na każdym spotkaniu można otrzymać max 4 pkt specyfikacja w materiałach do poszczególnych laboratoriów Projekt: temat wybieramy z listy udostępnionej przez wykładowcę implementacja: python 3 (algorytm, testy, dokumentacja) publiczne repozytorium na githubie (uaktualniane na bieżąco) obowiązkowe konsultacje w trakcie realizacji obrona w sesji na prawach egzaminu Szczegółowe zasady na stronie przedmiotu. slajd 23 Jacek Śmietański, Kraków 2016

PTBI Polskie Towarzystwo Bioinformatyczne http://ptbi.org.pl Konferencje: BIT (Bioinformatics in Torun), czerwiec Sympozjum PTBI, wrzesień Konkurs prac magisterskich. i slajd 24 Jacek Śmietański, Kraków 2016

Literatura uzupełniająca w języku polskim W języku polskim wydane zostały zaledwie trzy książki. Wszystkie dosyć dawno i wszystkie raczej dla biologów niż informatyków: 1. Jin Xiong, Podstawy bioinformatyki (2011) 2. Paul G. Higgs, Teresa K. Attwood, Bioinformatyka i ewolucja molekularna (2008) 3. A. D. Baxevanis, B. F. F. Ouellette, Bioinformatyka: podręcznik do analizy genów i białek (2005) slajd 25 Jacek Śmietański, Kraków 2016

Poziomy rozważań i centralny dogmat slajd 26 Jacek Śmietański, Kraków 2016

Poziomy organizacji (szczegółowość reprezentacji) Gatunek Populacja Organizm Tkanka Narząd slajd 27 Jacek Śmietański, Kraków 2016

Poziomy organizacji (2) Komórka Szlak metaboliczny slajd 28 Jacek Śmietański, Kraków 2016

Poziomy organizacji (3) Interakcja Cząsteczka slajd 29 Jacek Śmietański, Kraków 2016

Genom Materiał genetyczny organizmu, zbudowany z DNA. Praktycznie każda komórka posiada pełną kopię swojego genomu. U organizmów wyższych, genom znajduje się w jądrze komórkowym, upakowany w zestawie chromosomów (liczba chromosomów jest stała dla każdego gatunku; u człowieka są to 23 pary). slajd 30 Jacek Śmietański, Kraków 2016

Hierarchiczna organizacja chromosomów Upakowanie i lokalizacja w odrębnej przestrzeni komórkowej (jądro) zapewnia ochronę przechowywanej w DNA informacji. slajd 31 Jacek Śmietański, Kraków 2016

Obszary zainteresowań na poziomie molekularnym * Źródło: http://www.whatisepigenetics.com/wp-content/uploads/2013/07/ncrna.jpg slajd 32 Jacek Śmietański, Kraków 2016

Omy i omiki slajd 33 Jacek Śmietański, Kraków 2016

Centralny dogmat biologii molekularnej Wskazuje kierunki przepływu informacji biologicznej. slajd 34 Jacek Śmietański, Kraków 2016

Przestrzeń Komórka roślinna (powyżej) I zwierzęca (po prawej) slajd 35 Jacek Śmietański, Kraków 2016

Odrobina biologii slajd 36 Jacek Śmietański, Kraków 2016

Kwasy nukleinowe (DNA i RNA) - budowa Źródło: http://www.chemorganiczna.com/content/view/141/13/ Chemicznie DNA od RNA odróżnia budowa rdzenia cukrowego oraz rodzaje zasad (azotowych). Obrazowo: każda cząsteczka jest nitką (rdzeń cukrowo-fosforanowy), na którą nawleczone są koraliki czterech różnych rodzajów (zasady azotowe). slajd 37 Jacek Śmietański, Kraków 2016

Zasady azotowe Zasady purynowe: adenina (A), guanina (G) Zasady pirymidynowe: cytozyna (C), tymina (T), uracyl (U) Źródło: http://www.chemorganiczna.com/content/view/141/13/ slajd 38 Jacek Śmietański, Kraków 2016

DNA - kwas deoksyrybonukleinowy Pojedynczy element nici: deoksyryboza + fosforan + zasada azotowa (A,T,G,C) DNA tworzy strukturę helisy, złożoną z dwóch komplementarnych do siebie nici. slajd 39 Jacek Śmietański, Kraków 2016

DNA zasada komplementarności A T G C Każdej zasadzie na jednej nici odpowiada komplementarna jej zasada na drugiej nici. slajd 40 Jacek Śmietański, Kraków 2016

Replikacja Tworzenie kopii nici DNA (podczas podziału komórki). Proces bardzo dokładny. Źródło grafiki: http://pl.wikipedia.org/wiki/replikacja_dna slajd 41 Jacek Śmietański, Kraków 2016

Transkrypcja Synteza RNA na matrycy DNA (zachowana jest zasada komplementarności) A U C G G C T A W RNA zamiast tyminy (T) jest uracyl (U). Zakres błędów: 1 pomyłka na 10 4 10 5 nukleotydów. Dlaczego proces ten może być mniej dokładny niż replikacja? slajd 42 Jacek Śmietański, Kraków 2016

RNA Zasady azotowe wchodzące w skład nici RNA: - A (adenina) - G (guanina) - C (cytozyna) - U (uracyl) Źródło grafiki: http://bioinfo.mol.uj.edu.pl/articles/pawlica06 slajd 43 Jacek Śmietański, Kraków 2016

Rodzaje RNA mrna matrycowy (informacyjny), nośnik przepisanej z DNA informacji o sekwencji aminokwasów w białku. Ma cechy umożliwiające przyłączanie się do rybosomów i udział w syntezie białka. Wielkość zależna od wielkości kodowanego polipeptytdu. Zróżnicowana trwałość, raczej mało stabilny ncrna biorą udział w wielu procesach komórkowych, jak: regulacja transkrypcji, replikacji DNA, obróbki i modyfikacji innych cząsteczek RNA (transkryptów), np.: - rrna (rybosomowy, tworzy (wraz z białkami) rybosomy. Jeden z rrna jest katalizatorem tworzenia wiązania peptydowego (rybozymem). Różne rodzaje i wielkość (120-4700 zasad). rrna eukariontów i prokariontów zasadniczo się różnią. Długożyjący (stabilny). - trna (transportujący, mały (65-110 nt), przenosi zaktywowane aminokwasy do rybosomu) - snrna (małe jądrowe RNA) biorą udział w usuwaniu intronów i łączeniu egzonów; - mirna (mikro RNA) hamują translację; - sirna (małe interferencyjne RNA) ułatwiają degradację mrna; - slajd 44 Jacek Śmietański, Kraków 2016

Dojrzewanie mrna Proces usuwania intronów (fragmentów niekodujących) z pierwotnego transkryptu. slajd 45 Jacek Śmietański, Kraków 2016

Translacja Synteza białka na matrycy dojrzałego mrna. Źródło: http://library.thinkquest.org/c004535/media/translation.gif slajd 46 Jacek Śmietański, Kraków 2016

Kod genetyczny Każda trójka zasad koduje jeden określony aminokwas lub sygnał zakończenia translacji. Ile jest różnych kodonów? Źródło grafiki: http://upload.wikimedia.org/wikipedia/commons/d/d4/rna-codons.png slajd 47 Jacek Śmietański, Kraków 2016

Kod genetyczny (2) Zastanów się: Jakie konsekwencje niesie za sobą redundancja kodu genetycznego? Źródło: http://en.wikipedia.org/wiki/file:geneticcode21-version-2.svg slajd 48 Jacek Śmietański, Kraków 2016

Aminokwasy elementy budulcowe białek Ogólna budowa aminokwasów: slajd 49 Jacek Śmietański, Kraków 2016

Aminokwasy białkowe i slajd 50 Jacek Śmietański, Kraków 2016

Właściwości aminokwasów Np. wielkość, ładunek, hydrofobowość, aromatyczność,... Powyższe właściwości można zilustrować na diagramie Venna slajd 51 Jacek Śmietański, Kraków 2016

Białka N-terminus C-terminus H 3 N + -Gly-Ile-Val-Cys-Glu-Gln-...-Thr-Leu-His-Lys-Asn-COO - Podstawowa jednostka budulcowa i funkcjonalna organizmu. Ciąg aminokwasów połączonych wiązaniami peptydowymi. slajd 52 Jacek Śmietański, Kraków 2016

Struktury białek Poziomy przestrzennej organizacji białek: I rzędowa liniowa sekwencja aminokwasów II rzędowa opisuje lokalne pofałdowanie (α-helisy, β-kartki) III rzędowa struktura 3D pojedynczego łańcucha IV rzędowa struktura 3D całego białka (połączone wszystkie łańcuchy) Zwijanie białka (film): http://www.youtube.com/watch?v=fvbo3tqj6fe slajd 53 Jacek Śmietański, Kraków 2016

Struktura 2-rzędowa α-helisy β-kartki zwroty slajd 54 Jacek Śmietański, Kraków 2016

Centralny dogmat bioinformatyki DNA RNA Białko Sekwencja Struktura Funkcja Fenotyp Informacja genetyczna MVHLTPEEKT AVNALWGKVN VDAVGGEALG RLLVVYPWTQ RFFESFGDLS SPDAVMGNPK VKAHGKKVLG AFSDGLAHLD NLKGTFSQLS ELHCDKLHVD PENFRLLGNV LVCVLARNFG KEFTPQMQAA YQKVVAGVAN ALAHKYH Struktura molekularna Funkcja biochemiczna Fenotyp (objawy) slajd 55 Jacek Śmietański, Kraków 2016

Wykraczając poza pojedynczy organizm Przepływ informacji na poziomie całej populacji w szerokiej przestrzeni czasowej slajd 56 Jacek Śmietański, Kraków 2016

Kilka istotnych faktów Informacja genetyczna jest redundantna różne geny mogą kodować to samo białko Informacja strukturalna jest redundantna różne białka mogą mieć tą samą funkcję Jeden gen może mieć wiele funkcji Geny są jednowymiarowe, ale ich funkcja zależy od struktury trójwymiarowej kodowanego białka slajd 57 Jacek Śmietański, Kraków 2016

Najważniejsze zadania bioinformatyki slajd 58 Jacek Śmietański, Kraków 2016

Przeszłość teraźniejszość - przyszłość Tak jak wiek XIX był wiekiem węgla, pary i mechaniki, a wiek XX: wiekiem atomu i fizyki, tak wszystko wskazuje na to, że wiek XXI będzie wiekiem biologii i informatyki (Prof. Jacek Błażewicz) slajd 59 Jacek Śmietański, Kraków 2016

Genomika przykładowe zadania / zastosowania Sekwencjonowanie DNA i RNA Mapowanie genomów Analiza i porównywanie sekwencji Zarządzanie dużymi bazami danych (np. GenBank, EMBL, DDBJ) Algorytmy i miary podobieństwa (BLAST itp.) Biologia ewolucyjna slajd 60 Jacek Śmietański, Kraków 2016

Genomika (2) Przykład: Etapy analizy genomowego DNA Źródło: Biotechnologia, 3(70):2005, 24 slajd 61 Jacek Śmietański, Kraków 2016

Transkryptomika przykładowe zadania / zastosowania Sekwencjonowanie transkryptomów (projekty EST) Analiza mikromacierzy Poznawanie funkcji genów Badanie interakcji RNA-białko Rola RNA różnych typów slajd 62 Jacek Śmietański, Kraków 2016

Proteomika przykładowe zadania / zastosowania Klasyfikacja białek Przewidywanie struktury białek Przewidywanie funkcji białek Poszukiwanie miejsc wiążących Modelowanie molekularne Projektowanie leków (CADD) slajd 63 Jacek Śmietański, Kraków 2016

Metabolomika przykładowe zadania / zastosowania czyli biologia systemów: Modelowanie interakcji w złożonych systemach biologicznych (szlaki metaboliczne); Wizualizacja, grafy, sieci zależności slajd 64 Jacek Śmietański, Kraków 2016

Inne klasyfikacje genomika funkcjonalna (część transkryptomiki; badanie funkcji genów) bioinformatyka strukturalna (analiza struktur i interakcji: RNA, białka, kompleksy) slajd 65 Jacek Śmietański, Kraków 2016

Narzędzia programistyczne (biblioteki Bio*) slajd 66 Jacek Śmietański, Kraków 2016

Biblioteki dedykowane bioinformatykom Biopython http://biopython.org BioJava http://biojava.org BioPerl http://www.bioperl.org BioRuby http://bioruby.open-bio.org/ slajd 67 Jacek Śmietański, Kraków 2016

Inne popularne narzędzia / języki R http://www.r-project.org/ MatLab http://www.mathworks.com/products/matlab/ Narzędzia do modelowania molekularnego np. gromos: http://www.gromos.net/ slajd 68 Jacek Śmietański, Kraków 2016

Wstęp do bioinformatyki - podsumowanie wykładu 1. Nie ma jednoznacznej definicja bioinformatyki; niektórzy ograniczają ją jedynie do problemów związanych z biologią molekularną. My przyjmiemy jednak szeroką definicję zaproponowaną przez NIH. Bioinformatyka Biologia obliczeniowa 2. Przetwarzanie informacji biologicznej odbywa się na różnych poziomach organizacji, poczynając od gatunków i populacji przez osobniki, tkanki i narządy, komórki, szlaki metaboliczne i oddziałujące ze sobą pary, na pojedynczych cząsteczkach (DNA, RNA lub białek) kończąc. Istnieje wiele określeń uściślających konkretny obszar zainteresowań: genomika, proteomika, metabolomika, itp. 3. Centralny dogmat biologii molekularnej opisuje kierunek przepływu informacji biologicznej: DNA -> RNA -> białko. W DNA przechowywana jest informacja genetyczna i w tej formie przekazywana jest komórkom potomnym. RNA pełni funkcję pośrednika (mrna) i regulatora metabolizmu (inne rodzaje RNA). Białka są podstawowymi cząsteczkami decydującymi o budowie i funkcjonowaniu komórki (a zatem i całego organizmu). 4. Z powyższego dogmatu wynika podstawowa dla bioinformatyka zależność: sekwencja -> struktura -> funkcja. Przyjmuje się, że funkcja danego białka zależy od jego struktury przestrzennej, a ta z kolei od sekwencji nukleotydów w kodującym je genie. 5. Przepisanie informacji z RNA na białko następuje za pośrednictwem kodu genetycznego, w którym każdej trójce nukleotydów (kodon) odpowiada jeden aminokwas; istnieją także kodony stop przerywające translację. slajd 69 Jacek Śmietański, Kraków 2016

Podsumowanie (2) 6. Zadania bioinformatyki można (w pewnym uproszczeniu) pogrupować w obszary takie jak: genomika (analiza genów, czyli DNA), transkryptomika (analiza transktyptu, czyli RNA), proteomika (analiza białek), metabolobika (analiza szlaków metabolicznych). Wśród innych podziałów częstym określeniem jest też genomika funkcjonalna (koncentrująca się na funkcji genów), bioinformatyka strukturalna (np. przewidywanie struktur) czy biologia systemów (tworzenie i analiza rozbudowanych sieci interakcji). 7. Bioinformatyka, poza walorami poznawczymi i naukowymi, ma również ogromne zastosowanie praktyczne, np. w medycynie (prognozowanie ryzyka, indywidualne planowanie terapii), farmacji (projektowanie nowych leków), kryminalistyce, sądownictwie czy rolnictwie. 8. Dla kilku popularnych języków programowania stworzone zostały dedykowane biblioteki zawierające liczne funkcje przydatne w pracy bioinformatyka. Aktualnie najbardziej popularnym (aktywnie rozwijanym) narzędziem jest Biopython. W pracy bioinformatyka przydać się może równiez język R, pakiet MatLab czy dedykowane specjalistyczne środowiska (np. do modelowania molekularnego). slajd 70 Jacek Śmietański, Kraków 2016

Źródło: http://www.sciencecartoonsplus.com