Bioinformatyka 2 (BT172) Wykład 1 Struktura i organizacja kursu dr Krzysztof Murzyn adiunkt w Zakładzie Biofizyki WBtUJ pok. B028, tel. 664-6379 10.X.2005 PODSTAWOWE INFORMACJE 9 godz. wykładów (45 min, poniedziałek 16:00, sala D104) 30 godz. ćwiczeń (10 ćwiczeń po 3 45 min, sala D111), terminy: poniedziałek 10:00-12:15, 12:30-14:45, 17:00-18:15. Ćwiczenia rozpoczynają się 24 października (poniedziałek). Praca na zajęciach odbywa się w grupach dwu-osobowych. 6 godz. seminariów (2 135 min., sala D111, terminy: {9,16}.I.2006), obowiązuje podział na grupy ćwiczeniowe.
zaliczenie Skala ocen (max. 100 pkt) bdb > 90 pkt +db 85 90 pkt db 75 85 pkt +dst 70 75 pkt dst 60 70 pkt ndst < 60 pkt egzamin pisemny test wyboru, zadania; 30 pkt ćwiczenia w każdym ćwiczeniu: wykonanie 1 pkt sprawozdanie 4 pkt, najsłabsza ocena z dziesięciu sprawozdań jest odrzucana; 45 pkt prezentacja seminaryjna na wybrane zagadnienie z dziedziny bioinformatyki; 25 pkt ogłoszenia o kursie (zmiana terminu zajęć, oceny z ćwiczeń etc.) a także instrukcje do ćwiczeń, wykłady, materiały pomocnicze (publikacje, dokumentacja oprogramowania używanego w trakcie ćwiczeń etc.) będą udostępniane na stronach http://bioinfo.mol.uj.edu.pl KSIAŻKI Bioinformatics - Sequence and Genome Analysis, DW Mount, ***, obszerne omówienie podstawowych zagadnień bioinformatyki (cena od 80 do 150 USD) Bioinformatics - A Practical Guide to the Analysis of Genes and Proteins, AD Baxevanis & BFF Outellette, *, dobrze napisana książka, której niestety bliżej do beletrystyki niż podręcznika; wydanie polskojęzyczne w przygotowaniu (cena ok. 90 USD lub ok. 65 zł) Biological sequence analysis - Probabilistic models of proteins and nucleic acids, R Durbin, S Eddy, A Krogh, G Mitchison, **, bardzo dobra książka niestety omówienie tylko wąskich zagadnień: metody dopasowania sekwencji (B1), macierze podstawień (B1), HMM (B2). Algorytmy heurystyczne (BLAST, FASTA) omówione bardzo pobieżnie (cena: 40 USD).
WYKŁADY 10.X Struktura i organizacja kursu 17.X Uliniowienia wielosekwencyjne podstawowe definicje i zastosowania edycja uliniowień wielosekwencyjnych metody wyznaczania uliniowień wielosekwencyjnych ocena jakości uliniowienia 24.X Progresywne metody wyznaczania uliniowień wielosekwencyjnych ClustalW, T-coffee, Muscle bazy uliniowień referencyjnych 7.XI Probabilistyczne modele sekwencje białek i kwasów nukleinowych łańcuchy Markowa ukryte modele Markowa HMMER i baza PFAM 14.XI Domenowa architektura białek motywy sekwencyjne i sygnatury białkowe (PROSITE, PRINTS) domeny (CDD, SMART, ProDom) 21.XI Analiza kontroli metabolicznej 28.XI Molekularna analiza filogenetyczna I. WYKŁADY CD. podstawowe definicje i zastosowania modele podstawień nukleotydowych pakiet PHYLIP 5.XII Molekularna analiza filogenetyczna II. metody wyznaczania drzew filogenetycznych metody randomizacyjne 12.XII Metody nauczania maszynowego w zastosowaniach bioinformatycznych metody (klasyfikacja danych, ocena jakości klasyfikatora, heurystyka (NN, SVM, knn), wizualizacja danych wielowymiarowych (PCA, SOM)) zastosowania (wybrane aspekty numerycznej analizy danych z mikromacierzy, klasteryzacja hierarchiczna, klasyfikacja profili ekspresji genów)
ĆWICZENIA I SEMINARIA 24.X Globalne uliniowienia wielosekwencyjne 7.XI {14,21}.XI 28.XI Edycja uliniowień wielosekwencyjnych Ukryte modele Markowa Analiza kontroli metabolicznej 5.XII Motywy sekwencyjne i sygnatury białkowe 12.XII 19.XII Analiza tempa ewolucji molekularnej Rekonstrukcja drzew filogenetycznych w pakiecie PHYLIP 9.I Seminarium I 16.I Seminarium II 23.I Mikromacierze 30.I Przewidywanie struktury przestrzennej białek SPRAWOZDANIA Z ĆWICZEŃ FORMAT Sprawozdania z ćwiczeń należy dostarczać w terminie do 7 dni od wykonania danego ćwiczenia. Sprawozdanie z ćwiczeń powinno być dostarczone w postaci pojedynczego pliku w formacie PDF (Adobe Portable Document Format). Ogólnodostępny pakiet biurowy OpenOffice umożliwia bezpośrednie tworzenie dokumentów PDF. Aby tworzyć takie dokumenty w oparciu o komercyjny MicrosoftOffice można użyć programu pdf995 (http://www.pdf995.com). Wielkość pliku z deponowanym sprawozdaniem nie może przekroczyć 2 MB. W uzasadnionych przypadkach sprawozdanie może zawierać powiązania hipertekstowe do plików/dokumentów nie zawartych w deponowanym archiwum plikowym, a znajdujących się na serwerze bioinfo w udostępnionym poprzez sieć internet katalogu (np. http://bioinfo.mol.uj.edu.pl/students/ binf2_a0/data/editmsa/jalview.eps).
SPRAWOZDANIA Z ĆWICZEŃ ZAWARTOŚĆ Podstawowe dane dotyczące sprawozdania zebrane w tabeli na początku dokumentu. Anastazja Wierutna Ferdynand Nielepszy Edycja uliniowień wielosekwencyjnych binf2_a4 7.11.2005 12.11.2005 1. Opis celu ćwiczenia (lub puste miejsce jeśli tekiego celu nie udało się ustalić ;-)) 2. Odpowiedzi na pytania postawione w instrukcji do ćwiczeń, rozwiązania zadań i interpretację uzyskanych wyników należy podawać w stabelaryzowanej formie, powołując się na punkt instrukcji, którego dana odpowiedź dotyczy, np. 2 / 8... tak (por. rysunek 3, źródło: LabEditMSA/clustalx-2_8.msf) 3 / 4... gdzie lokalizacja pytania/zadania w instrukcji podawana jest w formacie numer etapu / podpunkt w pierwszej kolumnie tabeli. 3. Jeśli instrukcja do ćwiczeń zawierała zadania dodatkowe i obowiązkowa część ćwiczenia została w całości wykonana, w tej części sprawozdania może znaleźć się opis rozwiązania zadań dodatkowych w formie jak powyżej. DEPONOWANIE SPRAWOZDAŃ I PREZENTACJI proces deponowania zachodzi na drodze elektronicznej każda grupa ćwiczeniowa otrzymuje kartę haseł jednorazowych, na której każdemu ćwiczeniu/prezentacji przyporządkowany jest określony kod każdy kod można użyć tylko jeden raz, co oznacza, że dla danego ćwiczenia nie można wysyłać kolejnych wersji sprawozdania/prezentacji czas zdeponowania sprawozdania zachowywany jest na serwerze ćwiczeniowym; sprawozdania należy oddawać do 7 dni od zakończenia ćwiczeń, opóźnienia (max. 2 tygodnie) wpłyną na obniżenie oceny prezentacje należy deponować do 20.I.2006
KARTA KODÓW identyfikator grupy ćwiczeniowej hasło (bioinfo.mol.uj.edu.pl) : binf2_a4 : BDCV16K7 identyfikator ćwiczenia : kod ćwiczenia test : 86672 numer 1 : 37621 numer 2 : 38663 numer 3 : 46333 numer 4 : 43399 numer 5 : 11607 numer 6 : 90674 numer 7 : 63893 numer 8 : 91173 numer 9 : 95249 numer 10 : 95240 prezentacja 1: 68032 prezentacja 2: 32086 prezentacja 3: 20368 SEMINARIA szczegółowe kryteria oceny prezentacji oraz lista zagadnień do wyboru (wraz z odnośnikami literaturowymi) zostaną podane w terminie do 16.XI.2005. czas prezentacji: 20min, forma: Adobe PDF (pdflatex/pdfscreen), OpenOffice Impress, MicrosoftOffice PowerPoint) podstawą ocenienia prezentacji seminaryjnej, jest jej przygotowanie, wygłoszenie oraz zdeponowanie na serwerze bioinfo w terminie do 20.I.2006.