Statystyczna analiza danych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Statystyczna analiza danych"

Transkrypt

1 Statystyczna analiza danych ukryte modele Markowa, zastosowania Anna Gambin Instytut Informatyki Uniwersytet Warszawski

2 plan na dziś Ukryte modele Markowa w praktyce modelowania rodzin białek multiuliniowienia znajdowanie genów

3 model rodziny białek Cele: zbudowanie multiuliniowienia dla danej sekwencji identyfikacja rodziny

4 model rodziny białek d1 d2 d3 d4 i0 i1 i2 i3 i4 m0 m1 m2 m3 m4 m5 profilowy HMM

5 model rodziny białek długość sekwencji w przykładzie - 5 stany: match, insert, delete m0 - stan początkowy, m5 - końcowy alfabet - 20 aminokwasów plus dziura

6 model rodziny białek każdy stan typu match i insert ma swój rozkład na aa, które emituje: jeśli jest on jednostajny to emitujemy losowe sekwencje, jeśli jednopunktowy to dokładnie jedną sekwencję, jeśli pomiędzy to mamy pewną rodzinę sekwencji. stan typu delete emituje symbol dziury z prawdopodobieństwem 1

7 model rodziny białek dzięki modelowi hmm możemy zróżnicować podobieństwo różnych fragmentów sekwencji: algorytmy dynamiczne i BLAST mają ustalony parametr na karanie przerwy oraz jedną tablicę substytucyjną dla całej sewencji. hmm pozwala na zróżnicowanie tych parametrów w szczególności kara za przerwę może być w każdym miejscu inna. białka posiadają słabo i silnie konserwowane regiony (domenty funkcyjne).

8 model rodziny białek i0 gap open penalty i0 m0 gap extention penalty zaczynamy od treningu (czyli estymacji parametrów) alg. Bauma-Welcha, długość modelu - średnia długość sekwencji w rodzinie, inicjalizacja parametrów - rozkłady jednostajne.

9 hmm i multiuliniowienia

10 hmm i multiuliniowienia używamy sekwencji do wytrenowania modelu hmm (alg. Bauma-Welcha). dla każdej sekwencji algorytmem Viterbiego liczymy najbardziej prawdopodobną trajektorię stanów łańcucha. konstruujemy uliniowienie: dwa aminokwasy są w jednej kolumnie jeśli są wyemitowane w tym samym stanie typu match.

11 hmm i multiuliniowienia m0 m1 m2 m3 m4 d5 d6 m7 m8 m9 m10 C A E F D D H C D A E F P D DH m0 m1 i1 m2 m3 m4 d5 m6 m7 m8 m9 m10

12 hmm i multiuliniowienia C - A E F - D D H C D A E F P D D H

13 hmm i multiuliniowienia C A E F T P A V H C K E T T P A D H C A E T P D D H C A E F D D H C D A E F P D D H

14 hmm i multiuliniowienia m0 m1 m2 m3 m4 m5 m6 m7 m8 m9 m10 m0 m1 m2 m3 m4 m5 m6 m7 m8 m9 m10 m0 m1 m2 m3 d4 m5 m6 m7 m8 m9 m10 m0 m1 m2 m3 m4 d5 d6 m7 m8 m9 m10 m0 m1 i1 m2 m3 m4 d5 m6 m7 m8 m9 m10

15 hmm i multiuliniowienia C - A E F T P A V H C - K E T T P A D H C - A E - T P D D H C - A E F - - D D H C DA E F - P D D H

16 hmm i multiuliniowienia możliwe niejednoznaczności, np. dla modelu długości 2 i sekwencji: A B A C A B B A C A B A C o trajektoriach: m0 m1 i1 i1 m2 m3 m0 m1 i1 i1 i1 m2 m3 A B B A C w takich przypadkach fragmenty uliniowienia małymi literkami kodowane...

17 muliuliniowienie globin 400 białek globinowych zostało użytych do wytrenowania modelu. używając algorytmu Viterbiego uliniowiona całą rodzinę liczącą 625 białek globinowych. uzyskane uliniowienie porównane z uliniowieniem strukturalnym (które było znane dla 7 sekwencji).

18 potrafi namierzyć domeny funkcyjne w sekwencjach białek - reprezentowane jako HMMy (ponad 2000) jak annotować nową sekwencję? BLASTem znajdujemy homologi czasem sensowniej przeszukać domeny z PFAMa

19 polowanie na geny miliardy par zasad DNA do analizy: sekwencje genów poprzedzielane długimi niefunkcjonalnymi fragmentami. metody obliczeniowe automatycznej detekcji regionów kodujących bardzo pożądane. Genscan: popularne narzędzie oparte o HMMy Burge, C. and Karlin, S. (1997) Prediction of complete gene structures in human genomic DNA. J. Mol. Biol. 268,

20 emihidden Markov models p prawdopodobieństwo pozostania w stanie p n 1 (1 p) p-stwo, że czekamy n kroków rozkład geometryczny semihmm: 1.bez pętli 2.w stanie emitujemy całe słowo z dowolnego rozkładu

21 semihidden Markov models z każdym stanem losowa S związana zmienna L S Y S,l - rozkład długości słowa - rozkład na sekwencjach długości l algorytmy dla semihmm dużo bardziej skomplikowane, bo musimy nie tylko odkryć trajektorię stanów które wyemitowały daną sekwencję, ale również punkty podziału...

22 semihidden Markov models uogólniony algorytm Viterbiego nie działa w rozsądnym czasie... dodatkowe założenia niezbędne: długości długich regionów międzygenowych mają rozkład geometryczny. sekwencje w tych regionach typu iid.

23 semihidden Markov models DEF: parsowanie to sekwencja stanów q 1,g 2,...q r i długości d 1,d 2,...d r dla danej sekwencji s algorytm Viterbiego znajduje optymalne parsowanie że opt takie, P ( opt s) P ( s) dla wszystkich parsowań czyli opt z największym prawdopodobieństwem wyemitowało sekwencję s

24 struktura genu - powtórka długość około 500 bp region UTR podlega transkrypcji, ale nie translacji

25 struktura genu - powtórka

26 struktura genu - powtórka ma go 70% genów Scientific American image

27

28 r. geometryczny sekwencja dł. generowana przez ŁM rzędu 5

29 jednostajny: geometryczny: średnia 735

30 promotor ekson ekson końcowy genscan ' 6. ' 6 ' 3 ' -. :3 35 3;:; 3) 5 początkowy '.> ' ' 6. ' ( ' 3+ 6 ' :3 3 :3. 3: apple5 3 :3. 3: " 5 3 " 5 ' ' 30 3: (3) 3 0 : 6 >3 ' 6 '. >3 ' ' 7 ' : ' +" 5 : 373) ( 3 + :3 3 ( ' 7 ' '. 0 +" 5 ' 3) ( ' ' ' " ( >' ' 3) (' " 5 3 ' 3) (' " 5 ' ' 30 3: (3) 3 0 : 6 '6 3 >3. 0 >3 -'03 - ' : ' +" 5 -'037 Thursday, March 20, - ' 14 : ' " ' 0 ( >' 3 ( :3. 3: 5 3.; ( 33 : 3 3: ' +5 &>.> '-.. ' - * :.' ; 1 3 >' ' 0 3 ' 3) 03 ' 3 0 $ 030 '.. 0 : ## >' 3%%5 &>.>. 3-3 ' 30 >3 3'0 : 6 ' 3; > 5 ' &>.> 6' *3 & pojedynczy ekson >' 3 " '6 3 >3 8 *' 3 6 '. 0 5 >' 3 " '6 3 > *' 3 6 '. 0 5 >' $3 -; 3 ' 3) ' 3 ' - 0 $ 030 '.. 0 : >3 >' 3 6 >3 3$ 7 (&>.> > >3 sygnał polya = koniec 8 *' 37 ' 6 >3 3) 5 >3.3 >3 3'0 : 6 ' 3+;. $ ' 0 ' ' ' ' ' 0 3 ' : ' transkrypcji ' ' ' 6 >3 '. ' 30 3) ;?3$3 3 ' 0 ' 3 ' 0 6 &' 0 ' 0 ' 3 ' 3 03' & > ' 3 - > &>' ' >3 3' 3 6 * > ' 0 >3 1/?, : ' ( 0 $ -! /..>5 region międzygenowy +" 33 >3 3:3 0 : 3 ; > :> 3&>' ' > *30 *-, ; ( apple+5 03 * ' ' - 3 :3 3 ' >' ( + : 3 ' &3 ' 73) :3 3 " ( '03 - ' : ' ' 0 3 : " ' 0 ( + :3 3.. : 3 >3 * > 1 ' 0 ; '00 5 ' $ -5 ' ' ' &3 '. 3 3 :3 3 ' ' > :3 3 >3 ' ; > 5 >3 3 3 '. 3 6 $3 7 3* ' 3 : * : : 3..' *3 03. *30 *- > 03. 3; >3 '* 3 ' ' 3 >' $3 ' : '. ( *'* - ' 3+.' *3 >' 0 30 ' 0 >' ' 3 ' $3 7. : 3). - ' ; > ' /' $ $3 3-6 ' 30 ' ' 3). ' ' 003 /' $ / 03 ( //+ 6 >3 03. *30 *-?'* 3 ( +; 3=-5 >3 03 > :> 6 ' :3 3 ' : ' ## ' 3%% 5. : 6 ' ' & > ' '. ' : > (0 ' &>.>5 : *'* '.> 6 >3 ' :3 3 ' 3 ' : > ; >3 :3 3 ' 6 ' ' : ' ( : > ' 6 & ( + ' ' 3.> 3 '.. 0 :

31 introny/eksony zaczynają się po 1,2,3 bazie w kodonie... dla nici komplementarnej

32 dla każdego typu sekwencji GENSCAN modeluje rozkład długości: nieparametrycznie - histogram lub parametrycznie - r. geometryczny; skład sekwencji: łańcuch Markowa (1st, 5 stopnia, (nie)homogeniczny

33

34 zależności między kolumnami...

35 jak modelować?

36

37

38

39

40 max. dependence decomposition - MDD

41 pozycja 4 ma największy wpływ na inne...

42

43

44 budujemy drzewo...

45 trening ' 6. ' 6 ' 3 ' -. :3 35 3;:; 3) :3. 3: 5 3.; ( 33 : 3 3: ' +5 &>.> '-.. ' - * :.' ; 1 3 >' semihmma ' 0 3 ' 3) 03 ' 3 0 $ 030 '.. 0 : ## >' 3%%5 &>.>. 3-3 ' 30 >3 3'0 : 6 ' 3; > 5 ' &>.> 6' *3 & >' 3 " '6 3 >3 8 *' 3 6 '. 0 5 >' 3 " '6 3 > *' 3 6 '. 0 5 >' $3 -; 3 ' 3) ' 3 ' - 0 $ 030 '.. 0 : >3 >' 3 6 >3 3$ 7 (&>.> > >3 8 *' 37 ' 6 >3 3) 5 >3.3 >3 3'0 : 6 ' 3+;. $ ' 0 ' ' ' 2.5 ' Mb ' 0 3 bp ' : ' ' ' ' 6 >3 '. ' 30 3) ;?3$3 3 ' 0 ' 3 ' 0 6 &' 0 ' 0 ' 3 ' 3 03' & > ' 3 - > &>' ' >3 3' 3 6 * > ' 0 >3 1/?, 380 : ' ( genów 0 $ -! /..>5 +" 33 >3 3:3 0 : 3 ; > :> 3&>' ' > *30 *-, ; ( apple+5 03 * ' ' - 3 :3 3 ' >' ( + : 3 ' &3 ' 73) :3 3 " ( '03 - ' : ' ' 0 3 : " ' 0 ( + :3 3.. : 3 >3 * > 1 ' 0 ; '00 5 ' $ -5 ' ' ' &3 '. 3 3 :3 3 ' ' > :3 3 >3 ' ; > >3 3 3 ' eksony. 3 6 $3 7 3* ' 3 : * : : 3..' *3 03. *30 *- > 03. 3; >3 '* 3 ' ' 3 >' $3 ' : '. ( *'* - ' 3+.' *3 >' 0 30 ' 0 >' ' 3 ' $3 7. : 3) ' ; introny > ' /' $ $3 3-6 ' 30 ' ' 3). ' ' 003 /' $ / 03 ( //+ 6 >3 '.> ' ' 6. ' ( ' 3+ 6 ' :3 3 :3. 3: apple5 3 : *30 *-?'* 3 ( +; 3=-5 >3 03 3: " 5 3 " 5 ' ' 30 3: (3) 3 0 : > :> 6 ' :3 3 ' : ' ## ' 3%% 5. : 6 >3 ' 6 '. >3 ' ' 7 6 ' ' ' : ' +" 5 : 373) ( 3 + :3 3 ( ' 7 & > ' '. ' : > (0 ' +5 ' '. 0 +" 5 ' 3) ( ' '... &>.>5 : *'*. ' " ( >' '.> 6 >3 ' :3 3 ' 3 ' 1 3 ' 3) (' " : > ; >3 :3 3 ' 5 3 ' 3) (' " 6 ' ' : ' ( ' ' 30 3: (3) 3 0 : 6 '6 3 >3. 0 >3 -'03 - ' : ' +" 5 -' : > ' 6 & Thursday, March 20, - ' 14 : ' " ' 0 ( >' 3 ( 33 ( + ' ' 3.> 3 '.. 0 : 142 z pojedynczym eksonem

46 Y N,l generowane przez łańcuch Markowa rzędu 5 (3072 parametry) genscan ' 6. ' 6 ' 3 ' -. :3 35 3;:; 3) 5 3 :3. 3: 5 3.; ( 33 : 3 3: ' +5 &>.> '-.. ' - * :.' ; 1 3 >' ' 0 3 ' 3) 03 ' 3 0 $ 030 '.. 0 : ## >' 3 założenie: w danym &>.>. 3-3 ' 30 >3 3'0 : 6 ' 3; > ' &>.> 6' *3 & odcinku >' 3 " '6 3 liczba >3 8 *' 3genów 6 '. 0-5 >' 3 '6 3 > *' 3 6 '. 0 5 >' rozkład Poissona $3 -; 3 ' 3) ' 3 ' 0 $ 030 '.. 0 : >3 >' 3 6 >3 3$ (&>.> > > odległość 8 *' 37 ' 6 między >3 3) 5 >3 nimi.3 >3-3'0 6 ' 3+;. $ ' 0 ' ' ' ' ' 0 3 ' : ' ' ' ' 6 >3 '. ' 30 3) ; rozkład wykładniczy?3$3 3 ' 0 ' 3 ' 0 6 &' 0 ' 0 ' ' 3 03' & > ' 3 - > 03 5 &>' ' >3 3' 3 6 * > ' 0 > 1/?, : ' ( 0 $ -! /.. +" 33 >3 3:3 0 : 3 ; > :> 3&> ' L > *30 *-, ; ( apple 03 N r. geometryczny * ' ' - 3 :3 3 ' >'. 03 ( + : 3 ' &3 ' 73) :3 3 " ( 3 5 -'03 - ' : ' ' 0 3 : " ' 0 ( + :3 3.. : 3 >3 * 1 ' 0 ; '00 5 ' $ ' ' ' &3 '. 3 3 :3 3 ' ' > :3 3 >3 ' 3 3.3; > 5 >3 3 3 '. 3 6 $3 3* ' 3 : *

47 dł. intronów r. geometryczny '.> ' ' 6. ' ( ' 3+ 6 ' :3 3 :3. 3: apple5 3 :3. 3: " 5 3 " 5 ' ' 30 3: (3) 3 0 : 6 >3 ' 6 '. >3 ' ' 7 macierz wag 8 *' 37 ' 6 >3 3) 5 >3. 6 ' 3+;. $ ' ' ' ' ' 0 3 ' ' ' 6 >3 '. '?3$3 3 ' 0 ' 3 ' 0 6 &' ' 3 03' & > ' 3 - > macierz wag &>' ' >3 3' 3 6 * > 1/?, : ' ( 0 $ - +" 33 >3 3:3 0 : 3 ; > rozmiaru 15 ' > *30 *-, 03 * ' ' - 3 : ( + : 3 ' &3 ' '03 - ' : ' " ' 0 ( + :3 3.. : 1 ' 0 ; '00 5 ' 3 ' ' ' &3 '. 3 3 :3 3 ' 3 > : ; > 5 >3 3 3 '. 3* ' 3 : : : 3..' * wyuczony > 03. łańcuch 3; >3 ' ' 3 >' $3 ' : '. Markowa ' 3+.' *3 >' rzędu 0 30 ' 50 >' '. : 3). - ' ; > ' /. $3 3-6 ' 30 ' ' 3) ' 003 /' $ / 03 ( / 03. *30 *-?'* 3 ( +; 3=- > :> 6 ' :3 3 ' : ' ## ' 3% 6 ' ' 3 5 genscan

48 genscan algorytmem Viterbiego znajdujemy optymalne parsowanie: 5,>, : 7, 7 $7 37 "! -,337! 9 7 9! + <, > 7. 7, :7, $ 7 1 /, apple , >,29, 5 A %0 apple >@ : +, 5, 5, +,/ 7 $7 37 7(7 7-3 apple< 7 7, 21, 59 /7 7 $7 37 7? A %0 %% +, 7, 7 (7 ->,?> (1# =, apple 7< :, 2 $, 2, +?. 47, 5 apple, 7 3, apple :, 9 7,, 5 > 7< 7. > @ +<@7,5 <, ,/ (71 +@ 3@ 3,$ >@ $7 47? 37 A % , apple7 -, 7, 7, 7. 19, A %0 7., +, 7, 7.? 7 7, 7 75 >7 7> % 8, 5 ;%1, , 7 2 apple 7375 = 3 5 > 7. >7 6 6 apple >7 7, 7,/7 33$, 7 $7 /77 57, 75 : 6 6 (7 7. > apple >, 9 7 +@ 3@ $ 7 apple < 7 7 $7 >2 :, 9, @7 apple >, 3, /7 $ >@ 7= apple 75 3< /2 $/ >7 3 7> 3 7< apple 5 apple >7 7 + apple 7, apple apple >, ; <

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II 10 października 2013: Elementarz biologii molekularnej www.bioalgorithms.info Wykład nr 2 BIOINFORMATYKA rok II Komórka: strukturalna i funkcjonalne jednostka organizmu żywego Jądro komórkowe: chroniona

Bardziej szczegółowo

Elementy modelowania matematycznego

Elementy modelowania matematycznego Elementy modelowania matematycznego Łańcuchy Markowa: zagadnienia graniczne. Ukryte modele Markowa. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ KLASYFIKACJA STANÓW Stan i jest osiągalny

Bardziej szczegółowo

Wyszukiwanie podobnych sekwencji w bazach danych. Wyszukiwanie w sekwencji nukleotydów czy aminokwasów? Czułość i selektywność

Wyszukiwanie podobnych sekwencji w bazach danych. Wyszukiwanie w sekwencji nukleotydów czy aminokwasów? Czułość i selektywność Wersja 1.05 Wprowadzenie do Informatyki Biomedycznej Wykład 3: Wyszukiwanie w bazach sekwencji Przewidywanie genów Wydział Informatyki PB Marek Krętowski pokój 206 e-mail: m.kretowski@pb.edu.pl http://aragorn.pb.bialystok.pl/~mkret

Bardziej szczegółowo

Wstęp do Biologii Obliczeniowej

Wstęp do Biologii Obliczeniowej Wstęp do Biologii Obliczeniowej Zagadnienia na kolokwium Bartek Wilczyński 5. czerwca 2018 Sekwencje DNA i grafy Sekwencje w biologii, DNA, RNA, białka, alfabety, transkrypcja DNA RNA, translacja RNA białko,

Bardziej szczegółowo

Budowa kwasów nukleinowych

Budowa kwasów nukleinowych Bioinformatyka (wykład monograficzny) wykład 2. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas Budowa kwasów nukleinowych Kwasy nukleinowe (DA i RA) zbudowane są z nukleotydów

Bardziej szczegółowo

Modelowanie motywów łańcuchami Markowa wyższego rzędu

Modelowanie motywów łańcuchami Markowa wyższego rzędu Modelowanie motywów łańcuchami Markowa wyższego rzędu Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki 23 października 2008 roku Plan prezentacji 1 Źródła 2 Motywy i ich znaczenie Łańcuchy

Bardziej szczegółowo

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański BIOINFORMATYKA edycja 2016 / 2017 wykład 11 RNA dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Rola i rodzaje RNA 2. Oddziaływania wewnątrzcząsteczkowe i struktury

Bardziej szczegółowo

Przewidywanie genów i budowa białek

Przewidywanie genów i budowa białek Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański Przewidywanie genów i budowa białek Pytanie na dzisiaj: Jak odnaleźć gen w sekwencji DNA? CTTACTTCGAAGGCTGTGCTCCGCTCACCATCCAGAGCGGAGGTGCGGACCTTAAACTCACTCCTGGAGA

Bardziej szczegółowo

Dopasowania par sekwencji DNA

Dopasowania par sekwencji DNA Dopasowania par sekwencji DNA Tworzenie uliniowień (dopasowań, tzw. alignmentów ) par sekwencji PSA Pairwise Sequence Alignment Dopasowania globalne i lokalne ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych...

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych... Przedmowa... XI Część pierwsza Wprowadzenie i biologiczne bazy danych 1 Wprowadzenie... 3 Czym jest bioinformatyka?... 5 Cele... 5 Zakres zainteresowań... 6 Zastosowania... 7 Ograniczenia... 8 Przyszłe

Bardziej szczegółowo

BUDOWA I FUNKCJA GENOMU LUDZKIEGO

BUDOWA I FUNKCJA GENOMU LUDZKIEGO BUDOWA I FUNKCJA GENOMU LUDZKIEGO Magdalena Mayer Katedra i Zakład Genetyki Medycznej UM w Poznaniu 1. Projekt poznania genomu człowieka: Cele programu: - skonstruowanie szczegółowych map fizycznych i

Bardziej szczegółowo

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy

Bardziej szczegółowo

Statystyczna analiza danych

Statystyczna analiza danych Statystyczna analiza danych ukryte modele Markowa, algorytm EM Anna Gambin Instytut Informatyki Uniwersytet Warszawski ńczonymi l łańcuch Markowa Q, zbiór stanów M = (p k,l ) k,l Q, stochastyczna ścia

Bardziej szczegółowo

Wykład 14 Biosynteza białek

Wykład 14 Biosynteza białek BIOCHEMIA Kierunek: Technologia Żywności i Żywienie Człowieka semestr III Wykład 14 Biosynteza białek WYDZIAŁ NAUK O ŻYWNOŚCI I RYBACTWA CENTRUM BIOIMMOBILIZACJI I INNOWACYJNYCH MATERIAŁÓW OPAKOWANIOWYCH

Bardziej szczegółowo

Porównywanie i dopasowywanie sekwencji

Porównywanie i dopasowywanie sekwencji Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek pojawiła się nowa możliwość śledzenia ewolucji na poziomie molekularnym Ewolucja

Bardziej szczegółowo

TATA box. Enhancery. CGCG ekson intron ekson intron ekson CZĘŚĆ KODUJĄCA GENU TERMINATOR. Elementy regulatorowe

TATA box. Enhancery. CGCG ekson intron ekson intron ekson CZĘŚĆ KODUJĄCA GENU TERMINATOR. Elementy regulatorowe Promotory genu Promotor bliski leży w odległości do 40 pz od miejsca startu transkrypcji, zawiera kasetę TATA. Kaseta TATA to silnie konserwowana sekwencja TATAAAA, występująca w większości promotorów

Bardziej szczegółowo

MODELOWANIE STOCHASTYCZNE CZĘŚĆ II - ŁAŃCUCHY MARKOWA. Biomatematyka Dr Wioleta Drobik-Czwarno

MODELOWANIE STOCHASTYCZNE CZĘŚĆ II - ŁAŃCUCHY MARKOWA. Biomatematyka Dr Wioleta Drobik-Czwarno MODELOWANIE STOCHASTYCZNE CZĘŚĆ II - ŁAŃCUCHY MARKOWA Biomatematyka Dr Wioleta Drobik-Czwarno Polecane Łańcuchy Markowa wizualnie: http://setosa.io/ev/markov-chains/ Procesy stochastyczne Procesem stochastycznym

Bardziej szczegółowo

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2 ALEKSANDRA ŚWIERCZ Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2 Ekspresja genów http://genome.wellcome.ac.uk/doc_wtd020757.html A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów

Bardziej szczegółowo

Dopasowanie sekwencji (sequence alignment)

Dopasowanie sekwencji (sequence alignment) Co to jest alignment? Dopasowanie sekwencji (sequence alignment) Alignment jest sposobem dopasowania struktur pierwszorzędowych DNA, RNA lub białek do zidentyfikowanych regionów w celu określenia podobieństwa;

Bardziej szczegółowo

Geny i działania na nich

Geny i działania na nich Metody bioinformatyki Geny i działania na nich prof. dr hab. Jan Mulawka Trzy królestwa w biologii Prokaryota organizmy, których komórki nie zawierają jądra, np. bakterie Eukaryota - organizmy, których

Bardziej szczegółowo

Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów

Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów Stochastyczna dynamika z opóźnieniem czasowym w grach ewolucyjnych oraz modelach ekspresji i regulacji genów Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski Warszawa 14

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI WYDZIAŁ GEOINŻYNIERII, GÓRNICTWA I GEOLOGII KARTA PRZEDMIOTU Nazwa w języku polskim: Statystyka matematyczna Nazwa w języku angielskim: Mathematical Statistics Kierunek studiów (jeśli dotyczy): Górnictwo

Bardziej szczegółowo

EGZAMIN DYPLOMOWY, część II, 23.09.2008 Biomatematyka

EGZAMIN DYPLOMOWY, część II, 23.09.2008 Biomatematyka Biomatematyka W 200-elementowej próbie losowej z diploidalnej populacji wystąpiło 89 osobników genotypu AA, 57 osobników genotypu Aa oraz 54 osobników genotypu aa. Na podstawie tych danych (a) dokonaj

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Często dopasować chcemy nie dwie sekwencje ale kilkanaście lub więcej 2 Istnieją dokładne algorytmy, lecz są one niewydajne

Bardziej szczegółowo

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO Zał. nr 4 do ZW WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYKA STOSOWANA Nazwa w języku angielskim APPLIED STATISTICS Kierunek studiów (jeśli dotyczy): Specjalność

Bardziej szczegółowo

Wykład 5 Dopasowywanie lokalne

Wykład 5 Dopasowywanie lokalne Wykład 5 Dopasowywanie lokalne Dopasowanie par (sekwencji) Dopasowanie globalne C A T W A L K C A T W A L K C O W A R D C X X O X W X A X R X D X Globalne dopasowanie Schemat punktowania (uproszczony)

Bardziej szczegółowo

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12: KATEDRA SYSTEMÓW MULTIMEDIALNYCH Inteligentne systemy decyzyjne Ćwiczenie nr 12: Rozpoznawanie mowy z wykorzystaniem ukrytych modeli Markowa i pakietu HTK Opracowanie: mgr inż. Kuba Łopatka 1. Wprowadzenie

Bardziej szczegółowo

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment Dopasowywanie sekwencji Sequence alignment Drzewo filogenetyczne Kserokopiarka zadanie: skopiować 300 stron. Co może pójść źle? 2x ta sama strona Opuszczona strona Nadmiarowa pusta strona Strona do góry

Bardziej szczegółowo

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji. Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów

Bardziej szczegółowo

SCENARIUSZ LEKCJI BIOLOGII Z WYKORZYSTANIEM FILMU Transkrypcja RNA

SCENARIUSZ LEKCJI BIOLOGII Z WYKORZYSTANIEM FILMU Transkrypcja RNA SCENARIUSZ LEKCJI BIOLOGII Z WYKORZYSTANIEM FILMU Transkrypcja RNA SPIS TREŚCI: I. Wprowadzenie. II. Części lekcji. 1. Część wstępna. 2. Część realizacji. 3. Część podsumowująca. III. Karty pracy. 1. Karta

Bardziej szczegółowo

Programowanie dynamiczne i algorytmy zachłanne

Programowanie dynamiczne i algorytmy zachłanne Programowanie dynamiczne i algorytmy zachłanne Tomasz Głowacki tglowacki@cs.put.poznan.pl Zajęcia finansowane z projektu "Rozwój i doskonalenie kształcenia na Politechnice Poznańskiej w zakresie technologii

Bardziej szczegółowo

Proces rezerwy w czasie dyskretnym z losową stopą procentową i losową składką

Proces rezerwy w czasie dyskretnym z losową stopą procentową i losową składką z losową stopą procentową i losową składką Instytut Matematyki i Informatyki Politechniki Wrocławskiej 10 czerwca 2008 Oznaczenia Wprowadzenie ξ n liczba wypłat w (n 1, n], Oznaczenia Wprowadzenie ξ n

Bardziej szczegółowo

Przyrównywanie sekwencji

Przyrównywanie sekwencji Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański Przyrównywanie sekwencji 1. Porównywanie sekwencji wprowadzenie Sekwencje porównujemy po to, aby

Bardziej szczegółowo

Bioinformatyka II Modelowanie struktury białek

Bioinformatyka II Modelowanie struktury białek Bioinformatyka II Modelowanie struktury białek 1. Który spośród wymienionych szablonów wybierzesz do modelowania? Dlaczego? Struktura krystaliczną czy NMR (to samo białko, ta sama rozdzielczość)? Strukturę

Bardziej szczegółowo

Sieci Mobilne i Bezprzewodowe laboratorium 2 Modelowanie zdarzeń dyskretnych

Sieci Mobilne i Bezprzewodowe laboratorium 2 Modelowanie zdarzeń dyskretnych Sieci Mobilne i Bezprzewodowe laboratorium 2 Modelowanie zdarzeń dyskretnych Plan laboratorium Generatory liczb pseudolosowych dla rozkładów dyskretnych: Generator liczb o rozkładzie równomiernym Generator

Bardziej szczegółowo

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*

Bardziej szczegółowo

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010)

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010) Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie

Bardziej szczegółowo

TRANSKRYPCJA - I etap ekspresji genów

TRANSKRYPCJA - I etap ekspresji genów Eksparesja genów TRANSKRYPCJA - I etap ekspresji genów Przepisywanie informacji genetycznej z makrocząsteczki DNA na mniejsze i bardziej funkcjonalne cząsteczki pre-mrna Polimeraza RNA ETAP I Inicjacja

Bardziej szczegółowo

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19 WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19 Witold Dyrka 14 marca 2019 1 Wprowadzenie 1.1 Definicje bioinformatyki Według polskiej Wikipedii [1], Bioinformatyka interdyscyplinarna dziedzina

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova M. Czoków, J. Piersa 2010-12-21 1 Definicja Własności Losowanie z rozkładu dyskretnego 2 3 Łańcuch Markova Definicja Własności Losowanie z rozkładu

Bardziej szczegółowo

Wybrane techniki badania białek -proteomika funkcjonalna

Wybrane techniki badania białek -proteomika funkcjonalna Wybrane techniki badania białek -proteomika funkcjonalna Proteomika: umożliwia badanie zestawu wszystkich (lub prawie wszystkich) białek komórkowych Zalety analizy proteomu w porównaniu z analizą trankryptomu:

Bardziej szczegółowo

PRZYRÓWNANIE SEKWENCJI

PRZYRÓWNANIE SEKWENCJI http://theta.edu.pl/ Podstawy Bioinformatyki III PRZYRÓWNANIE SEKWENCJI 1 Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych), które posiadają

Bardziej szczegółowo

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012)

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012) Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie

Bardziej szczegółowo

3 Przeszukiwanie baz danych

3 Przeszukiwanie baz danych Spis treści 3 Przeszukiwanie baz danych 1 3.1 Heurystyczne algorytmy...................... 1 3.1.1 FASTA........................... 1 3.1.2 BLAST........................... 3 3.2 Macierze substytucyjne.......................

Bardziej szczegółowo

Algorytmy MCMC (Markowowskie Monte Carlo) dla skokowych procesów Markowa

Algorytmy MCMC (Markowowskie Monte Carlo) dla skokowych procesów Markowa Algorytmy MCMC (Markowowskie Monte Carlo) dla skokowych procesów Markowa Wojciech Niemiro 1 Uniwersytet Warszawski i UMK Toruń XXX lat IMSM, Warszawa, kwiecień 2017 1 Wspólne prace z Błażejem Miasojedowem,

Bardziej szczegółowo

Metody i analiza danych

Metody i analiza danych 2015/2016 Metody i analiza danych Macierze Laboratorium komputerowe 2 Anna Kiełbus Zakres tematyczny 1. Funkcje wspomagające konstruowanie macierzy 2. Dostęp do elementów macierzy. 3. Działania na macierzach

Bardziej szczegółowo

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania Wprowadzenie do Informatyki Biomedycznej Wykład 2: Metody dopasowywania sekwencji Wydział Informatyki PB Dopasowywanie sekwencji (ang. sequence alignment) Dopasowywanie (przyrównywanie) sekwencji polega

Bardziej szczegółowo

Badanie doboru naturalnego na poziomie molekularnym

Badanie doboru naturalnego na poziomie molekularnym Badanie doboru naturalnego na poziomie molekularnym Podstawy ewolucji molekulanej Jak ewoluują sekwencje Zmiany genetyczne w ewolucji Mutacje tworzą nowe allele genów Inwersje zmieniają układ genów na

Bardziej szczegółowo

Wstęp do programowania

Wstęp do programowania Wstęp do programowania Algorytmy zachłanne, programowanie dynamiczne Paweł Daniluk Wydział Fizyki Jesień 2014 P. Daniluk(Wydział Fizyki) WP w. IX Jesień 2014 1 / 26 Algorytmy zachłanne Strategia polegająca

Bardziej szczegółowo

Dr. habil. Anna Salek International Bio-Consulting 1 Germany

Dr. habil. Anna Salek International Bio-Consulting 1 Germany 1 2 3 Drożdże są najprostszymi Eukariontami 4 Eucaryota Procaryota 5 6 Informacja genetyczna dla każdej komórki drożdży jest identyczna A zatem każda komórka koduje w DNA wszystkie swoje substancje 7 Przy

Bardziej szczegółowo

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2 Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2 Dr hab. inż. Agnieszka Wyłomańska Faculty of Pure and Applied Mathematics Hugo Steinhaus Center Wrocław University of Science and

Bardziej szczegółowo

Zasady oceniania rozwiązań zadań 48 Olimpiada Biologiczna Etap centralny

Zasady oceniania rozwiązań zadań 48 Olimpiada Biologiczna Etap centralny Zasady oceniania rozwiązań zadań 48 Olimpiada Biologiczna Etap centralny Zadanie 1 1 pkt. za prawidłowe podanie typów dla obydwu zwierząt oznaczonych literami A oraz B. A. ramienionogi, B. mięczaki A.

Bardziej szczegółowo

Porównywanie i dopasowywanie sekwencji

Porównywanie i dopasowywanie sekwencji Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek narodziła się nowa dyscyplina nauki ewolucja molekularna Ewolucja molekularna

Bardziej szczegółowo

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Przyrównanie sekwencji Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych),

Bardziej szczegółowo

Tematy prac magisterskich i doktorskich

Tematy prac magisterskich i doktorskich Tematy prac magisterskich i doktorskich Stochastyczna dynamika z opóźnieniami czasowymi w grach ewolucyjnych oraz modelach ekspresji i regulacji genów Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki

Bardziej szczegółowo

Przybliżone algorytmy analizy ekspresji genów.

Przybliżone algorytmy analizy ekspresji genów. Przybliżone algorytmy analizy ekspresji genów. Opracowanie i implementacja algorytmu analizy danych uzyskanych z eksperymentu biologicznego. 20.06.04 Seminarium - SKISR 1 Wstęp. Dane wejściowe dla programu

Bardziej szczegółowo

OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) Algorytmy i Struktury Danych PIŁA

OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) Algorytmy i Struktury Danych PIŁA OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) 16.01.2003 Algorytmy i Struktury Danych PIŁA ALGORYTMY ZACHŁANNE czas [ms] Porównanie Algorytmów Rozwiązyjących problem TSP 100 000 000 000,000 10 000 000

Bardziej szczegółowo

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych Rozdział 1 Zmienne losowe, ich rozkłady i charakterystyki 1.1 Definicja zmiennej losowej Niech Ω będzie przestrzenią zdarzeń elementarnych. Definicja 1 Rodzinę S zdarzeń losowych (zbiór S podzbiorów zbioru

Bardziej szczegółowo

Metody oceny ryzyka operacyjnego

Metody oceny ryzyka operacyjnego Instytut Matematyki i Informatyki Wrocław, 10 VII 2009 Bazylejski Komitet Nadzoru Bankowego Umowa Kapitałowa - 1988 Opracowanie najlepszych praktyk rynkowych w zakresie zarządzania ryzykiem Nowa Umowa

Bardziej szczegółowo

MultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński

MultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński MultiSETTER: web server for multiple RNA structure comparison Sandra Sobierajska Uniwersytet Jagielloński Wprowadzenie Budowa RNA: - struktura pierwszorzędowa sekwencja nukleotydów w łańcuchu: A, U, G,

Bardziej szczegółowo

WYKŁAD: Klasyczny przepływ informacji ( Dogmat) Klasyczny przepływ informacji. Ekspresja genów realizacja informacji zawartej w genach

WYKŁAD: Klasyczny przepływ informacji ( Dogmat) Klasyczny przepływ informacji. Ekspresja genów realizacja informacji zawartej w genach WYKŁAD: Ekspresja genów realizacja informacji zawartej w genach Prof. hab. n. med. Małgorzata Milkiewicz Zakład Biologii Medycznej Klasyczny przepływ informacji ( Dogmat) Białka Retrowirusy Białka Klasyczny

Bardziej szczegółowo

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego IBS PAN, Warszawa 9 kwietnia 2008 Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego mgr inż. Marcin Jaruszewicz promotor: dr hab. inż. Jacek Mańdziuk,

Bardziej szczegółowo

Klonowanie molekularne Kurs doskonalący. Zakład Geriatrii i Gerontologii CMKP

Klonowanie molekularne Kurs doskonalący. Zakład Geriatrii i Gerontologii CMKP Klonowanie molekularne Kurs doskonalący Zakład Geriatrii i Gerontologii CMKP Etapy klonowania molekularnego 1. Wybór wektora i organizmu gospodarza Po co klonuję (do namnożenia DNA [czy ma być metylowane

Bardziej szczegółowo

Algorytmy memetyczne (hybrydowe algorytmy ewolucyjne)

Algorytmy memetyczne (hybrydowe algorytmy ewolucyjne) Algorytmy memetyczne (hybrydowe algorytmy ewolucyjne) 1 2 Wstęp Termin zaproponowany przez Pablo Moscato (1989). Kombinacja algorytmu ewolucyjnego z algorytmem poszukiwań lokalnych, tak że algorytm poszukiwań

Bardziej szczegółowo

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie Jarosław Kotowicz Instytut Matematyki Uniwersytet w

Bardziej szczegółowo

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa M. Czoków, J. Piersa 2012-01-10 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego 3 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego

Bardziej szczegółowo

Elementy modelowania matematycznego

Elementy modelowania matematycznego Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski

Bardziej szczegółowo

Bioinformatyka II Modelowanie struktury białek

Bioinformatyka II Modelowanie struktury białek Bioinformatyka II Modelowanie struktury białek 1. Który spośród wymienionych szablonów wybierzesz do modelowania dla każdego z podanych przypadków? Dlaczego? Struktura krystaliczną czy NMR (to samo białko,

Bardziej szczegółowo

Podstawy biologiczne - komórki. Podstawy biologiczne - cząsteczki. Model komórki eukariotycznej. Wprowadzenie do Informatyki Biomedycznej

Podstawy biologiczne - komórki. Podstawy biologiczne - cząsteczki. Model komórki eukariotycznej. Wprowadzenie do Informatyki Biomedycznej Wprowadzenie do Informatyki Biomedycznej Wykład 1: Podstawy bioinformatyki Wydział Informatyki PB Podstawy biologiczne - komórki Wszystkie organizmy zbudowane są z komórek komórka jest skomplikowanym systemem

Bardziej szczegółowo

Translacja i proteom komórki

Translacja i proteom komórki Translacja i proteom komórki 1. Kod genetyczny 2. Budowa rybosomów 3. Inicjacja translacji 4. Elongacja translacji 5. Terminacja translacji 6. Potranslacyjne zmiany polipeptydów 7. Translacja a retikulum

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*

Bardziej szczegółowo

Proces Poissona. Proces {N(t), t 0} nazywamy procesem zliczającym jeśli N(t) oznacza całkowitą liczbę badanych zdarzeń zaobserwowanych do chwili t.

Proces Poissona. Proces {N(t), t 0} nazywamy procesem zliczającym jeśli N(t) oznacza całkowitą liczbę badanych zdarzeń zaobserwowanych do chwili t. Procesy stochastyczne WYKŁAD 5 Proces Poissona. Proces {N(t), t } nazywamy procesem zliczającym jeśli N(t) oznacza całkowitą liczbę badanych zdarzeń zaobserwowanych do chwili t. Proces zliczający musi

Bardziej szczegółowo

Algorytmy ewolucyjne - algorytmy genetyczne. I. Karcz-Dulęba

Algorytmy ewolucyjne - algorytmy genetyczne. I. Karcz-Dulęba Algorytmy ewolucyjne - algorytmy genetyczne I. Karcz-Dulęba Algorytmy klasyczne a algorytmy ewolucyjne Przeszukiwanie przestrzeni przez jeden punkt bazowy Przeszukiwanie przestrzeni przez zbiór punktów

Bardziej szczegółowo

Nowoczesne systemy ekspresji genów

Nowoczesne systemy ekspresji genów Nowoczesne systemy ekspresji genów Ekspresja genów w organizmach żywych GEN - pojęcia podstawowe promotor sekwencja kodująca RNA terminator gen Gen - odcinek DNA zawierający zakodowaną informację wystarczającą

Bardziej szczegółowo

Generowanie i optymalizacja harmonogramu za pomoca

Generowanie i optymalizacja harmonogramu za pomoca Generowanie i optymalizacja harmonogramu za pomoca na przykładzie generatora planu zajęć Matematyka Stosowana i Informatyka Stosowana Wydział Fizyki Technicznej i Matematyki Stosowanej Politechnika Gdańska

Bardziej szczegółowo

Ogólnopolska Konferencja Aktuarialna Zagadnienia aktuarialne teoria i praktyka Warszawa, IE SGH 2009

Ogólnopolska Konferencja Aktuarialna Zagadnienia aktuarialne teoria i praktyka Warszawa, IE SGH 2009 Rafał M. Łochowski Szkoła Główna Handlowa w Warszawie O pewnym modelu pojawiania się szkód Ogólnopolska Konferencja Aktuarialna Zagadnienia aktuarialne teoria i praktyka Warszawa, IE SGH 2009 Modele pojawiania

Bardziej szczegółowo

PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE

PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE D: PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE I. Strategia zachłanna II. Problem przetasowań w genomie III. Sortowanie przez odwrócenia IV. Algorytmy przybliżone V. Algorytm zachłanny

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW DOPASOWYWANIE SEKWENCJI 1. Miary podobieństwa sekwencji aminokwasów 2. Zastosowanie programów: CLUSTAL OMEGA BLAST Copyright 2013, Joanna Szyda

Bardziej szczegółowo

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki Genetyka ogólna wykład dla studentów II roku biotechnologii Andrzej Wierzbicki Uniwersytet Warszawski Wydział Biologii andw@ibb.waw.pl http://arete.ibb.waw.pl/private/genetyka/ Wykład 5 Droga od genu do

Bardziej szczegółowo

Spacery losowe generowanie realizacji procesu losowego

Spacery losowe generowanie realizacji procesu losowego Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z

Bardziej szczegółowo

Gry hazardowe, gry ewolucyjne, ekspresja genów, tak czy owak łańcuchy Markowa

Gry hazardowe, gry ewolucyjne, ekspresja genów, tak czy owak łańcuchy Markowa Kampus Ochota 18 kwietnia 2015 Gry hazardowe, gry ewolucyjne, ekspresja genów, tak czy owak łańcuchy Markowa Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski Andrey (Andrei)

Bardziej szczegółowo

Algorytm Genetyczny. zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych

Algorytm Genetyczny. zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych Algorytm Genetyczny zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych Dlaczego Algorytmy Inspirowane Naturą? Rozwój nowych technologii: złożone problemy obliczeniowe w

Bardziej szczegółowo

Optymalizacja. Symulowane wyżarzanie

Optymalizacja. Symulowane wyżarzanie dr hab. inż. Instytut Informatyki Politechnika Poznańska www.cs.put.poznan.pl/mkomosinski, Maciej Hapke Wyżarzanie wzrost temperatury gorącej kąpieli do takiej wartości, w której ciało stałe topnieje powolne

Bardziej szczegółowo

Techniki optymalizacji

Techniki optymalizacji Techniki optymalizacji Symulowane wyżarzanie Maciej Hapke maciej.hapke at put.poznan.pl Wyżarzanie wzrost temperatury gorącej kąpieli do takiej wartości, w której ciało stałe topnieje powolne zmniejszanie

Bardziej szczegółowo

Bioinformatyka wykład 9

Bioinformatyka wykład 9 Bioinformatyka wykład 9 14.XII.21 białkowa bioinformatyka strukturalna krzysztof_pawlowski@sggw.pl 211-1-17 1 Plan wykładu struktury białek dlaczego? struktury białek geometria i fizyka modyfikacje kowalencyjne

Bardziej szczegółowo

KODY SYMBOLI. Kod Shannona-Fano. Algorytm S-F. Przykład S-F

KODY SYMBOLI. Kod Shannona-Fano. Algorytm S-F. Przykład S-F KODY SYMBOLI Kod Shannona-Fano KODOWANIE DANYCH, A.Przelaskowski Metoda S-F Kod Huffmana Adaptacyjne drzewo Huffmana Problemy implementacji Kod Golomba Podsumowanie Kod drzewa binarnego Na wejściu rozkład:

Bardziej szczegółowo

Wybrane techniki badania białek -proteomika funkcjonalna

Wybrane techniki badania białek -proteomika funkcjonalna Wybrane techniki badania białek -proteomika funkcjonalna Proteomika: umożliwia badanie zestawu wszystkich (lub prawie wszystkich) białek komórkowych Zalety analizy proteomu np. w porównaniu z analizą trankryptomu:

Bardziej szczegółowo

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCHY KOMPETENCJI EFEKTY KSZTAŁCENIA

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCHY KOMPETENCJI EFEKTY KSZTAŁCENIA I. KARTA PRZEDMIOTU. Nazwa przedmiotu: MATEMATYKA STOSOWANA 2. Kod przedmiotu: Ms 3. Jednostka prowadząca: Wydział Nawigacji i Uzbrojenia Okrętowego 4. Kierunek: Nawigacja 5. Specjalność: Nawigacja morska

Bardziej szczegółowo

Wprowadzenie. DNA i białka. W uproszczeniu: program działania żywego organizmu zapisany jest w nici DNA i wykonuje się na maszynie białkowej.

Wprowadzenie. DNA i białka. W uproszczeniu: program działania żywego organizmu zapisany jest w nici DNA i wykonuje się na maszynie białkowej. Wprowadzenie DNA i białka W uproszczeniu: program działania żywego organizmu zapisany jest w nici DNA i wykonuje się na maszynie białkowej. Białka: łańcuchy złożone z aminokwasów (kilkadziesiąt kilkadziesiąt

Bardziej szczegółowo

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11 Modele DSGE Jerzy Mycielski Maj 2008 Jerzy Mycielski () Modele DSGE Maj 2008 1 / 11 Modele DSGE DSGE - Dynamiczne, stochastyczne modele równowagi ogólnej (Dynamic Stochastic General Equilibrium Model)

Bardziej szczegółowo

przedmiot podstawowy obowiązkowy polski drugi

przedmiot podstawowy obowiązkowy polski drugi KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 07/08 IN--008 STATYSTYKA W INŻYNIERII ŚRODOWISKA Statistics in environmental engineering

Bardziej szczegółowo

Wykład 10 2008-04-30. Bioinformatyka. Wykład 9. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

Wykład 10 2008-04-30. Bioinformatyka. Wykład 9. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM Bioinformatyka Wykład 9 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Konsekwencje zestawieo wielu sekwencji - rodziny białkowe, domeny, motywy i wzorce 2 Bioinformatyka,

Bardziej szczegółowo

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1 Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1 Konrad Miziński, nr albumu 233703 1 maja 2015 Zadanie 1 Parametr λ wyestymowano jako średnia z próby: λ = X n = 3.73 Otrzymany w

Bardziej szczegółowo

Analiza składowych głównych

Analiza składowych głównych Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi

Bardziej szczegółowo