Porównywanie sekwencji białkowych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Porównywanie sekwencji białkowych"

Transkrypt

1 Bioinformatyka -9 Bioinformatyka Wykład 4. E. Banachowicz Zakład Biofizyki Molekularnej Porównywanie sekwencji białkowych Wykład 4,

2 Bioinformatyka -9 Porównywanie sekwencji elem porównania białek jest między innymi przypisanie informacji znanej dla jednej cząsteczki drugiej cząsteczce (genomika/proteomika porównawcza) DN RN białko sekwencja struktura funkcja Porównywanie sekwencji Pierwsze pytanie biologa molekularnego, kiedy odkryje nową sekwencję: zy w bazie sekwencji są już sekwencje podobne? Sekwencje są identyczne nic nowego. Sekwencja jest podobna (ma krewnych ) nowy członek znanej rodziny Sekwencja ma kilka podobnych regionów, motywów lub domen można zaproponować funkcję Nie ma znaczącego podobieństwa dużo pracy.. Wykład 4,

3 Bioinformatyka -9 Identyfikacja sekwencji w BD Identyfikacja przez porównanie z innymi sekwencjami Zestawienia sekwencji = uliniowienie = =porównanie = alignment Identyfikacja sekwencji i jej funkcji Białka spokrewnione ze sobą (posiadające wspólnego przodka) mają podobne sekwencje, strukturę i funkcję Pewne istotne fragmenty (motywy) są konserwatywne i charakteryzują rodzinę białek (Bazy rodzin białkowych: PROSIE, PRINS, InterPro) Wykład 4,

4 Bioinformatyka -9 Identyfikacja sekwencji i jej funkcji? czy wszystkie białka spokrewnione mają tę samą funkcję?? czy podobieństwo krótkich fragmentów może być przypadkowe?? czy wszystkie białka pełniące tę samą funkcje muszą być spokrewnione? Ewolucyjne podstawy porównywania sekwencji Nic w Biologii (Bioinformatyce) nie ma sensu jeśli rozpatruje się to w oderwaniu od ewolucji. heodosis Dobzhansky (9975) Wykład 4, 4

5 Bioinformatyka -9 homologia/homoplazja homologia -podobieństwo ze względu na wspólnego przodka (dywergencja) homoplazja podobieństwo ze względu na konwergencję Homologia Podobieństwo Sekwencje homologiczne są podobne Sekwencje podobne nie muszą być homologiczne! Homologia = wspólny przodek Wykład 4, 5

6 Bioinformatyka -9 Homologi Hemoglobina (łańcuch α) Mioglobina Leghemoglobina hemoglobina, mioglobina i leghemoglobina Zachowawczość struktury przestrzennej Wykład 4, 6

7 Bioinformatyka -9 czas Rodziny Homologi Drzewo ewolucyjne globin. homologi: ortologi -różne gatunki, taka sama funkcja (specjacja) paralogi-podobna funkcja, ale ewoluowały niezależnie (duplikacja,ten sam organizm) analogi: różne sekwencje, różne motywy, ale identyczna orientacja ważnych aminokwasów prymitywna, pierwotna globina wiążąca tlen Molecular ell Biology,4ed. Lodish, Berk, Matsudaira, Kaiser, Krieger, Scott, Zipursky, and Darnell Wykład 4, 7

8 Bioinformatyka -9 Ortologi duplikacja oryginalny gen duplikacja specjacja b gatunek b,c,a c gen b b b gen a a a t t t gatunek b,a Homologi: paralogi (wspólny przodek w czasie duplikacji) ortologi (wspólny przodek w czasie specjacji: a-a) krowa Rodzina - homologi Rybonukleaza wołowa (enzym trawienny) człowiek Paralogi Rybonukleaza ludzka (enzym trawienny) angiogenina ludzka (stymuluje wzrost naczyń krwionośnych) (Biochemistry, J.Berg, J.ymoczko, L.Stryer.,PWN 5). Wykład 4, 8

9 Bioinformatyka -9 Dlaczego homologia jest ważna? homologia sugeruje wspólną strukturę i funkcję Homologia podobne funkcje, konserwatywność fragmentów rypsyna (myszy) P746 i trypsyna (langusty) P765 Wykład 4, 9

10 Bioinformatyka -9 S-S S-S S-S Składowa centrum aktywnego, odpowiedzialna za specyficzność substratową Układ przeniesienia ładunku Porównaj z: ezx.pdb, M9U P765 P746 Wykład 4,

11 Bioinformatyka -9 Homologia podobne funkcje a4v.pdb 5lyz.pdb nalogi Izomeraza triozofosforanowa (E 5...),4 - beta Ksylanaza Wykład 4,

12 Bioinformatyka -9 nalogi His57, sp, Ser95 His64, sp, Ser proteazy serynowe hydrolizujące wiązanie peptydowe Modele ewolucji Wykład 4,

13 Bioinformatyka -9 Modele ewolucji zy gen człowieka jest bardziej podobny do genu szympansa czy goryla? Potrzebny jest ilościowy model ewolucji. Np. wyznaczenie dopasowania sekwencji i obliczenie odsetka pozycji, na których wystąpiły różnice. Punktacja obszar dopasowania MGQKLMRVRVEGGPEVLKLRSDIVPIPKDHQVLI VRVEGPEVLRISDIVPIPKDHQVLIEIRSGS dopasowanie przerwa niedopasowanie S punktacja za dopasowanie Score = Max(S) S = (dopasowania) - (niedopasowania) - (przerwy) Wykład 4,

14 Bioinformatyka -9 liczba identycznych aminokwasów Jakość dopasowania globalnego Dla dopasowań globalnych: porównanie obliczonej wartości dla danego dopasowania z wartościami obliczonymi dla wielu dopasowań przypadkowych sekwencji o podobnym składzie i długości przykład: dopasowanie sekwencji α hemoglobiny ludzkiej i mioglobiny ludzkiej identyczne aminokwasy identyczne aminokwasy wszystkie możliwe zestawienia sekwencji, zliczanie identycznych dopasowanie Wykład 4, 4

15 Bioinformatyka -9 Jakość dopasowań zestawienia sekwencji z przerwami, zliczanie identycznych 8 identyczne aminokwasy we fragmencie o długości % identycznych aminokwasów. zy jest to znaczące podobieństwo? S = (dopasowania) - (niedopasowania) - (przerwy) Jakość dopasowań Dla dopasowań globalnych: - porównanie obliczonej wartości dla danego dopasowania z wartościami obliczonymi dla wielu dopasowań przypadkowych sekwencji o podobnym składzie i długości przypadkowe sekwencje o podobnym składzie: sekwencja jednego z białek zostaje wielokrotnie potasowna Wykład 4, 5

16 Bioinformatyka -9 liczba przyrównań Jakość dopasowań punktacja: tożsamość: + przerwa: 5 S = (dopasowania) - (przerwy) szansa uzyskania takiego odchylenia w przypadkowej punktacja sekwencji przyrównania wynosi : hemoglobina α i mioglobiny punktacja przyrównania Modele ewolucji sekwencji białkowej PM (point accepted mutations = punktowe mutacje utrwalone) macierz uwzględniająca tempo i typ możliwych podstawień aminokwasowych. Wykład 4, 6

17 Bioinformatyka -9 Wykład 4, 7 Macierz PM5 wartości w macierzy są proporcjonalne do logarytmu z (cz. docelowej/cz.tła) zbudowana na podstawie analizy par blisko spokrewnionych (PM) i ekstrapolowana do 5PM ekstrapolacje można przeprowadzić dla różnych odległości ewolucyjnych PM duże PM stosuje się do porównywania sekwencji o dużym stopniu dywergencji ewolucyjnej małe PM do badania sekwencji podobnych P 6 S W V 4 4 B Z X R N D Q E G H I L K M P S W V B Z X N D Q 4 E 4-7 G 5-7 H 6 I 5 4 L 6 4 K 5 M Dayhoff PM 5 Matrix R 6

18 Bioinformatyka -9 Wykład 4, 8 zestawienie białek wysoka punktacja oznacza: -> podstawienia są częste + -> podstawienia są częste tam gdzie jest utrwalone tam gdzie jest utrwalone P 6 S W V 4 4 B Z X R N D Q E G H I L K M P S W V B Z X N D Q 4 E 4-7 G 5-7 H 6 I 5 4 L 6 4 K 5 M R 6 Dayhoff PM 5 Matrix

19 Bioinformatyka -9 Wykład 4, 9 Pierwotne białko zestawieni sekwencji wysoka punktacja W W oznacza : inne podstawienia nie są możliwe tam gdzie W jest utrwalone W W W W W W W W W W W W W W W W W W W P 6 S W V 4 4 B Z X R N D Q E G H I L K M P S W V B Z X N D Q 4 E 4-7 G 5-7 H 6 I 5 4 L 6 4 K 5 M R 6 Dayhoff PM 5 Matrix

20 Bioinformatyka -9 skład aminokwasowy białek {rgos and Mcaldon} lanina jest bardzo pospolita minokwasy % 8..7 D 5. E 6..9 G 7. H. I 5. K 5.7 L 9. M.4 N 4.4 P 5. Q 4. R 5.7 S V 6.6 W.. ryptofan jest bardzo rzadki Małe, polarne Macierz PM5 S, Ser, hr Małe, hydrofobowe V,Val I,Ile Duże, naładowane R, rg K, Lys Wykład 4,

21 Bioinformatyka -9 Macierze BLOSUM Powstały w oparciu o bazę BLOKS dopasowanie sekwencji daleko spokrewnionych (oszacowanie częstotliwości docelowych, bez modelu ewolucyjnego) Rodzina macierzy: różnice (indeksu) związane są z maksymalnym stopniem identyczności sekwencji wziętych do obliczeń BLOSUM6 BLOSUM9 do analizy sekwencji blisko spokrewnionych BOLSUM do analizy odległych ewolucyjnie sekwencji Wykład 4,

22 Bioinformatyka -9 Reprezentacja macierzy BLOSUM 6 DEHKR naładowane NQS polarne GP hydrofobowe ILMVW duże i hydrofobowe Biochemistry, Berg, Jeremy M.; ymoczko, John L.; and Stryer, Lubert. New ork: W. H. reeman and o.; (), Rys.7.9 Statystyczne znaczenie dopasowań jaka jest wartość/ istotność dopasowania? Jaka jest wartość świadczy o homologii, a jaka o przypadkowym podobieństwie? Wykład 4,

23 Bioinformatyka -9 z macierzami substytucji Jakość dopasowań punktacja: BLOSUM6 otwarcie przerwy: wydłużenie przerwy: identyczne podobne = substytucje konserwatywne S = (dopasowania) - (niedopasowania) - (przerwy) z macierzami substytucji pozwala wykryć homologię białek pokrewnych w mniejszym stopniu Jakość dopasowań punktacja: BLOSUM6 otwarcie przerwy: wydłużenie przerwy: Mioglobina ludzka Leghemoglobina z łubinu identyczność: % S = (dopasowania) - (niedopasowania) - (przerwy) Wykład 4,

24 Bioinformatyka -9 liczba przyrównań liczba przyrównań Jakość dopasowań Mioglobina ludzka Leghemoglobina z łubinu punktacja przyrównania (tylko identyczne) punktacja przyrównania (BLOSUM6) () punktacja oparta o identyczność -szansa dopasowanie tylko na zasadzie przypadku : (B) punktacja oparta o konserwatywne substytucje - szansa dopasowanie tylko na zasadzie przypadku : Jakość dopasowania Dla sekwencji dłuższych niż aminokwasów identyczność wyższa niż 5% prawie na pewno nie jest przypadkowa prawdopodobieństwo homologii identyczność niższa niż 5% mało prawdopodobne, żeby podobieństwo było statystycznie istotne Brak statystycznej istotności nie wyklucza homologii Wykład 4, 4

25 Bioinformatyka -9 hemoglobina, mioglobina i leghemoglobina Zachowawczość struktury przestrzennej α hemoglobina (homo sapiens) P6995 (Expasy) mioglobina (homo sapiens) P44 (Expasy) leghemoglobina (łubin) P9 (Expasy) EMBOSS Pairwise lignment lgorithms Wykład 4, 5

26 Bioinformatyka -9 Global alignment SIM P44, P6995 Wykład 4, 6

27 Bioinformatyka -9 Jakość dopasowania lokalnego () unkcja gęstości prawdopodobieństwa = rozkład wartości granicznej E(S) rozkład spodziewanych dopasowań, które mają wartość przynajmniej równą S E (S) = K m n exp(-λs) Statystyczne znaczenie dopasowań jaka jest wartość/ istotność dopasowania? Dla dopasowań globalnych: porównanie obliczonej wartości dla danego dopasowania z wartościami obliczonymi dla wielu dopasowań przypadkowych sekwencji o podobnym składzie i długości Wykład 4, 7

28 Bioinformatyka -9 E (S) = K m n exp -λs Expected value, wartość oczekiwana sekwencji mających wartość co najmniej S S bit score, punktacja podobieństwa m range of alignment, długość porównywanego segmentu n wielkość bazy λ - określa wpływ systemu punktowania K liczba powtarzających się segmentów w przeszukiwanej sekwencji Bit Score unormowany score, wartość uniezależniona od długości sekwencji Dopasowanie sekwencji Wykład 4, 8

29 Bioinformatyka -9 lgorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne (BLS, S) metody statystyczne (modele Markova, statystyka Bayesa) Rodzaje dopasowań pokrycie sekwencji globalne, lokalne liczba sekwencji porównywanych para (pairwise sequence alignment) więcej niż dwie (multiple sequences alignment) Pokrycie sekwencji dopasowanie globalne dopasowanie wzdłuż całej sekwencji (zastosowanie: do białek składających się z pojedynczej domeny lub homologicznych słabo zróżnicowanych) dopasowanie lokalne uwzględnia domenową naturę białek, szuka subsekwencji (zastosowanie: do białek wielodomenowych, mrn z sekwencją genomową) 59 Wykład 4, 9

30 Bioinformatyka -9 Liniowe zestawienie dwóch sekwencji Pairwise Sequence lignment sekwencja BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER sekwencja Ogólne spojrzenie na problem laresansom BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER Wykład 4,

31 Bioinformatyka -9 BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER Wykład 4,

32 Bioinformatyka -9 BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER Wykład 4,

33 Bioinformatyka -9 Insercja/Delecja => GPS zestawienie jeden-do-jeden przerwy odzwierciedlają wydarzenia ewolucyjne (wyzwanie dla programistów) BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER laresansom Wykład 4,

34 Bioinformatyka -9 Insercja/Delecja => GPS BEERGLEDILGERGSOUWERM BEERN-LEDLGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS BEERGLEDILGERGSOUWERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Wykład 4, 4

35 Bioinformatyka -9 Insercja/Delecja => GPS BEERGLEDILGERG-SOUWERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS BEERGLEDILGERG--SOUWERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Wykład 4, 5

36 Bioinformatyka -9 Insercja/Delecja => GPS BEERGLEDILGERG---SOUWERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS BEERGLEDILGERG---SOU-WERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Wykład 4, 6

37 Bioinformatyka -9 Insercja/Delecja => GPS BEERGLEDILGERG---SOU--WERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS G<->W = -7 G<->G = +5 BEERGLEDILGER-G--SOU--WERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Wykład 4, 7

38 Bioinformatyka -9 Insercja/Delecja => GPS G<->W = -7 G<->G = +5 BEERGLEDILGER-G--SOU--WERM -BEERN-LED-LGERDWGLSOUWRRWER <-> = <-> = + laresansom Macierze punktowe (DotPlot) Macierze DotPlot opierają się na ocenie wizualnej i czasami skuteczniejsze niż alignment wykrywają fragmenty powtarzające się, rearanżacje i podobieństawa lokalne Dotter: Wykład 4, 8

39 Bioinformatyka -9 H I S S E Q E N E H I S S E Q E N E Dotter niektóre układy punktów tworzą ścieżkę każda ścieżka odpowiada jednemu dopasowaniu M S E Q U E N E H I S S E Q E N E M S E Q U E N E H I S S E Q E N E znaleźć najlepszą ścieżkę! M S E Q U E N E Dotter kropka w miejscu dopasowania układ kropek tworzy ścieżkę M S E Q U E N E H I S S E Q E N E M S E Q U E N E H I S S E Q E N E zy wprowadzenie przerwy da lepsze dopasowanie? M S E Q U E N E Wykład 4, 9

40 Bioinformatyka -9 H I S S E Q E N E Dotter wprowadzenie przerwy wydłużenie ścieżki M S E Q U E N E H I S S E Q E N E M S E Q U E N E H I S S E Q E N E M S E Q U E N E M S E Q U E N E H I S S E Q - E N E Najlepsza ścieżka? G G Wykład 4, 4

41 Bioinformatyka -9 Najlepsza ścieżka? G G każda ścieżka odpowiada jakiemuś dopasowaniu która z nich jest optymalna? Najlepsza ścieżka Madryt Poznań optymalna? najszybsza? najkrótsza? Wykład 4, 4

42 Bioinformatyka -9 Najlepsza ścieżka najlepsza ścieżka = Zestawienia sekwencji zależy od sposobu punktowania. tożsamości, podobieństwa, przerwy Wartości substytucji i kary za przerwy schemat wartościowania I: (match) dopasowany: + (mismatch) niedopasowany: (gap) przerwa: (nie-afiniczne kary za przerwy każda przerwa traktowana jest tak samo) schemat wartościowania II: dopasowany: + niedopasowany: otwarcie przerwy: G przedłużenie przerwy: L (afiniczne kary za przerwy kara za otwarcie, kary za przedłużenie ) Wykład 4, 4

43 Bioinformatyka -9 Punktacja obszar dopasowania GGGGGGG GGGG-GGGGG dopasowanie przerwa niedopasowanie S punktacja za dopasowanie Score = Max(S) S = (dopasowania) - (niedopasowania) - (przerwy) Punktowanie przerw non-affine model (nieafinicznie): równo (match:4, mismatch:, gap:) affine model (afinicznie): G + L n (match:4, mismatch:, gap creation:-8, gap:) GGG------G GGGGG : :7 GGG------G GGGGG : : G 4 4 G Wykład 4, 4

44 Bioinformatyka -9 DotPlot -metody najprościej: kropka w miejscu identycznych znaków w sekwencjach lepiej: zastosowanie tablicy podobieństw (macierzy substytucji) kropka w miejscu, gdzie wartość podobieństwa przekracza określoną wartość lepiej: porównywanie okienek wstawianie kropek tam, gdzie ciąg n-liter ma punktację większą niż pewna wartość, albo jest określona liczba identycznych liter jeszcze lepiej: odfiltrowanie mniej istotnych kropek DotPlot najprostsza metoda W. Makałowski, 5 Wykład 4, 44

45 Bioinformatyka -9 DotPlot najprostsza metoda DotPlot metoda okienkowa obliczyć punktację w okienku o zadanym rozmiarze (window size) ocenić czy punktacja spełnia określone warunki (threshold) przesunąć okienko o zadany krok (step) Wykład 4, 45

46 Bioinformatyka -9 DotPlot metoda okienkowa kropka= x brak kropki= o window size: 9 threshold: 6 step: DotPlot metoda okienkowa window size: 9 threshold: step: 6 Wykład 4, 46

47 Bioinformatyka -9 DotPlot metoda okienkowa window size: 9 threshold: step: 6 DotPlot metoda okienkowa window size: 9 threshold: step: 6 Wykład 4, 47

48 Bioinformatyka -9 DotPlot metoda okienkowa window size: 9 threshold: step: 6 Programowanie dynamiczne najlepsza ścieżka schemat wartościowania I: (match) dopasowany: + (mismatch) niedopasowany: (gap) przerwa: (nie-afiniczne kary za przerwy każda przerwa traktowana jest tak samo) G G Wykład 4, 48

49 Bioinformatyka -9 Programowanie dynamiczne zasady: G G dopasowane z = dopasowane z = + NULL dopasowane z = dopasowane z NULL = Programowanie dynamiczne G G + Wykład 4, 49

50 Bioinformatyka -9 Programowanie dynamiczne G G + stopniowe poszerzanie ścieżek Programowanie dynamiczne G G + + stopniowe poszerzanie ścieżek Wykład 4, 5

51 Bioinformatyka -9 Programowanie dynamiczne G G + + stopniowe poszerzanie ścieżek Programowanie dynamiczne G G stopniowe poszerzanie ścieżek Wykład 4, 5

52 Bioinformatyka -9 Programowanie dynamiczne G G stopniowe poszerzanie ścieżek wszystkie punkty musza zostać zbadane Programowanie dynamiczne G G stopniowe poszerzanie ścieżek Wykład 4, 5

53 Bioinformatyka -9 Programowanie dynamiczne G G stopniowe poszerzanie ścieżek G- G Programowanie dynamiczne G G stopniowe poszerzanie ścieżek G- G Wykład 4, 5

54 Bioinformatyka -9 G G G lgorytm Needleman -Wunsh a znaleźć zestawienie z max score! G G macierz elementy ij powtarzaj ij = max( i,j + S( i,b j ), i,j + d, i,j + d) sekwencja B sekwencja = j = i = lgorytm Needleman -Wunsh a pseudo-code (tworzenie macierzy ): for i= to lengh() (i,) <- for j= to lengh(b) (,j) <- for i= to lengh() for j= to lengh(b) { choice <- (i,j + S((i),B(j)) choice <- (i,j) + d choice <- (i,j) + d (i,j) <- max(choice,choice,choice) } i = j = Wykład 4, 54

55 Bioinformatyka -9 lgorytm Needleman -Wunsh a ten element macierzy ma zawsze, dla każdego zestawienia najwyższą wartość Odtworzenie zestawienia sekwencji, dającego najwyższą punktację, polega na sprawdzaniu źródeł ( możliwości), z których można dotrzeć do danego punktu i,j: jeśli choice to zestawienie (i) z B(j) jeśli choice to zestawinie (i) z przerwą jeśli choise to zestawienia B(j) z przerwą lgorytm Needleman -Wunsh a pseudo-code (budowania zestawienia): lignment <- lignmentb <- i <- length() j <- length(b) while (i> ND j>) { Score <- (i,j) ScoreDiag <- (i,j) ScoreUp <- (i, j) ScoreLeft <- (i,j) if (Score S((i),B(j))==ScoreDiag { lignment <- (i)+ lignment lignmentb <- B(j)+ lignmentb i <- i j <- j } Wykład 4, 55

56 Bioinformatyka -9 lgorytm Needleman -Wunsh a Score <- (i,j) ScoreDiag <- (i,j) ScoreUp <- (i, j) ScoreLeft <- (i,j) if (Score S((i),B(j))==ScoreDiag { lignment <- (i)+ lignment lignmentb <- B(j)+ lignmentb i <- i j <- j } else if (Score == ScoreLeft d) { lignment <- (i)+ lignment lignmentb <- - + lignmentb i <- i } } while (i>=) {. lgorytm Needleman -Wunsh a else if (Score == ScoreLeft d) { lignment <- (i)+ lignment lignmentb <- - + lignmentb i <- i } otherwise (Score == ScoreUp d) { lignment <- - + lignment lignmentb <- B(j)+ lignmentb j <- j } Wykład 4, 56

57 Bioinformatyka -9 lgorytm Needleman -Wunsh a while (i>=) { lignment <- (i) + ligment lignmentb <- - + ligmentb i <- i } while (j>=) { lignment <- - + ligment lignmentb <- B(j) + ligmentb j <- j } } Podsumowanie lgorytmy porównywania sekwencji oparte na programowaniu dynamicznym gwarantują znalezienie optymalnego (najlepszego) zestawienia dwóch sekwencji wymagają dużych rezerw pamięci i czasu Wykład 4, 57

58 Bioinformatyka -9 Programowanie dynamiczne Metody dynamiczne dobre są do zestawienia (porównania) dwóch sekwencji Jeśli celem jest znalezienie sekwencji homologicznych przeszukać trzeba bazę sekwencji. Przeszukać = porównać każdą sekwencję w bazie z zadaną sekwencją (query) to może być trudne.. Metody dynamiczne są raczej powolne i wymagają pamięci (na np. zapamiętanie macierzy (nm) = O(nm)) Programowanie dynamiczne Rozmiar baz danych (rośnie ekspotencjalnie) białkowa: ok. reszt aminokwasowych nukleotydowa: nukleotydów zas pracy komputera z mocą obliczeniową 7 komórek macierzy/sekundę (pełne zestawienie metodami dynamicznymi) białko aminokwasów: 5 godzin dla bazy białkowej DN nukleotydów: 5555 godzin ( dni) w GenBanku (wg. W. Makałowskiego) Wykład 4, 58

59 Bioinformatyka -9 Koniec Wykład 4, 59

Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM Bioinformatyka (wykład monograficzny) wykład 5. E. Banachowicz Zakład Biofizyki Molekularnej IF UM http://www.amu.edu.pl/~ewas lgorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne

Bardziej szczegółowo

Bioinformatyka. Porównywanie sekwencji

Bioinformatyka. Porównywanie sekwencji Bioinformatyka Wykład 5 E. Banachowicz Zakład Biofizyki Molekularnej IF UM 1 http://www.amu.edu.pl/~ewas Porównywanie sekwencji Pierwsze pytanie biologa molekularnego, kiedy odkryje nową sekwencję: zy

Bardziej szczegółowo

PRZYRÓWNANIE SEKWENCJI

PRZYRÓWNANIE SEKWENCJI http://theta.edu.pl/ Podstawy Bioinformatyki III PRZYRÓWNANIE SEKWENCJI 1 Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych), które posiadają

Bardziej szczegółowo

Dopasowanie sekwencji (sequence alignment)

Dopasowanie sekwencji (sequence alignment) Co to jest alignment? Dopasowanie sekwencji (sequence alignment) Alignment jest sposobem dopasowania struktur pierwszorzędowych DNA, RNA lub białek do zidentyfikowanych regionów w celu określenia podobieństwa;

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów

Bardziej szczegółowo

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Przyrównanie sekwencji Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych),

Bardziej szczegółowo

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010)

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010) Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów

Bardziej szczegółowo

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012)

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012) Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie

Bardziej szczegółowo

Dopasowania par sekwencji DNA

Dopasowania par sekwencji DNA Dopasowania par sekwencji DNA Tworzenie uliniowień (dopasowań, tzw. alignmentów ) par sekwencji PSA Pairwise Sequence Alignment Dopasowania globalne i lokalne ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Często dopasować chcemy nie dwie sekwencje ale kilkanaście lub więcej 2 Istnieją dokładne algorytmy, lecz są one niewydajne

Bardziej szczegółowo

Porównywanie i dopasowywanie sekwencji

Porównywanie i dopasowywanie sekwencji Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek narodziła się nowa dyscyplina nauki ewolucja molekularna Ewolucja molekularna

Bardziej szczegółowo

Porównywanie i dopasowywanie sekwencji

Porównywanie i dopasowywanie sekwencji Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek pojawiła się nowa możliwość śledzenia ewolucji na poziomie molekularnym Ewolucja

Bardziej szczegółowo

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment Dopasowywanie sekwencji Sequence alignment Drzewo filogenetyczne Kserokopiarka zadanie: skopiować 300 stron. Co może pójść źle? 2x ta sama strona Opuszczona strona Nadmiarowa pusta strona Strona do góry

Bardziej szczegółowo

Przyrównywanie sekwencji

Przyrównywanie sekwencji Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański Przyrównywanie sekwencji 1. Porównywanie sekwencji wprowadzenie Sekwencje porównujemy po to, aby

Bardziej szczegółowo

Spis treści 8 Ewolucja molekularna... 87. 9 Ewolucyjne podstawy porównywania sekwencji... 87. 9.1 Identyfikacja sekwencji i jej funkcji...

Spis treści 8 Ewolucja molekularna... 87. 9 Ewolucyjne podstawy porównywania sekwencji... 87. 9.1 Identyfikacja sekwencji i jej funkcji... Spis treści 8 Ewolucja molekularna... 87 9 Ewolucyjne podstawy porównywania sekwencji... 87 9.1 Identyfikacja sekwencji i jej funkcji... 87 9.2 Homologia... 88 9.3 Modele ewolucji sekwencji białkowej...

Bardziej szczegółowo

Wykład 5 Dopasowywanie lokalne

Wykład 5 Dopasowywanie lokalne Wykład 5 Dopasowywanie lokalne Dopasowanie par (sekwencji) Dopasowanie globalne C A T W A L K C A T W A L K C O W A R D C X X O X W X A X R X D X Globalne dopasowanie Schemat punktowania (uproszczony)

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych...

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych... Przedmowa... XI Część pierwsza Wprowadzenie i biologiczne bazy danych 1 Wprowadzenie... 3 Czym jest bioinformatyka?... 5 Cele... 5 Zakres zainteresowań... 6 Zastosowania... 7 Ograniczenia... 8 Przyszłe

Bardziej szczegółowo

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania Wprowadzenie do Informatyki Biomedycznej Wykład 2: Metody dopasowywania sekwencji Wydział Informatyki PB Dopasowywanie sekwencji (ang. sequence alignment) Dopasowywanie (przyrównywanie) sekwencji polega

Bardziej szczegółowo

Dopasowanie par sekwencji

Dopasowanie par sekwencji BIOINFORMTYK edycja 2016 / 2017 wykład 3 Dopasowanie par sekwencji dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Idea i cele dopasowania sekwencji 2. Definicje

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW DOPASOWYWANIE SEKWENCJI 1. Miary podobieństwa sekwencji aminokwasów 2. Zastosowanie programów: CLUSTAL OMEGA BLAST Copyright 2013, Joanna Szyda

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa 4. Etapy konstrukcji drzewa filogenetycznego

Bardziej szczegółowo

Bioinformatyka. Podsumowanie algorytmów dynamicznych

Bioinformatyka. Podsumowanie algorytmów dynamicznych Bioinformatyka Wykład 5 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas Podsumowanie algorytmów dynamicznych Algorytmy porównywania sekwencji oparte na programowaniu dynamicznym

Bardziej szczegółowo

Bioinformatyka. z sylabusu... (wykład monograficzny) wykład 1. E. Banachowicz. Wykład monograficzny Bioinformatyka.

Bioinformatyka. z sylabusu... (wykład monograficzny) wykład 1. E. Banachowicz. Wykład monograficzny Bioinformatyka. Bioinformatyka (wykład monograficzny) wykład 1. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas z sylabusu... Wykład 1, 2006 1 Co to jest Bioinformatyka? Zastosowanie technologii

Bardziej szczegółowo

plezjomorfie: podobieństwa dziedziczone po dalszych przodkach (c. atawistyczna)

plezjomorfie: podobieństwa dziedziczone po dalszych przodkach (c. atawistyczna) Podobieństwa pomiędzy organizmami - cechy homologiczne: podobieństwa wynikające z dziedziczenia - apomorfie: podobieństwa dziedziczone po najbliższym przodku lub pojawiająca się de novo (c. ewolucyjnie

Bardziej szczegółowo

Generator testów 1.3.1 Bioinformatyka_zdalne wer. 1.0.13 / 0 Strona: 1

Generator testów 1.3.1 Bioinformatyka_zdalne wer. 1.0.13 / 0 Strona: 1 Przedmiot: Bioinformatyka Nazwa testu: Bioinformatyka_zdalne wer. 1.0.13 Nr testu 0 Klasa: WNB UZ Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Model Markowa substytucji aminokwasów w mutagenezie białek zakłada...

Bardziej szczegółowo

Wykład Bioinformatyka 2012-09-24. Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

Wykład Bioinformatyka 2012-09-24. Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki Bioinformatyka Wykład 7 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Plan Bioinformatyka Ewolucyjne podstawy Bioinformatyki Filogenetyka Bioinformatyczne narzędzia

Bardziej szczegółowo

Statystyczna analiza danych

Statystyczna analiza danych Statystyczna analiza danych ukryte modele Markowa, zastosowania Anna Gambin Instytut Informatyki Uniwersytet Warszawski plan na dziś Ukryte modele Markowa w praktyce modelowania rodzin białek multiuliniowienia

Bardziej szczegółowo

Wykład 10 2008-04-30. Bioinformatyka. Wykład 9. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

Wykład 10 2008-04-30. Bioinformatyka. Wykład 9. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM Bioinformatyka Wykład 9 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Konsekwencje zestawieo wielu sekwencji - rodziny białkowe, domeny, motywy i wzorce 2 Bioinformatyka,

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Wyszukiwanie sekwencji Jak wyszukad z baz danych bioinformatycznych sekwencje podobne do sekwencji zadanej (ang. query

Bardziej szczegółowo

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji Bioinformatyka wykład 5: dopasowanie sekwencji prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie podobieństwa sekwencji stanowi podstawę wielu gałęzi

Bardziej szczegółowo

Wstęp do Biologii Obliczeniowej

Wstęp do Biologii Obliczeniowej Wstęp do Biologii Obliczeniowej Zagadnienia na kolokwium Bartek Wilczyński 5. czerwca 2018 Sekwencje DNA i grafy Sekwencje w biologii, DNA, RNA, białka, alfabety, transkrypcja DNA RNA, translacja RNA białko,

Bardziej szczegółowo

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Konstruowanie drzew filogenetycznych Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Drzewa filogenetyczne ukorzenione i nieukorzenione binarność konstrukcji topologia (sposób rozgałęziana

Bardziej szczegółowo

Generator testów Bioinformatyka wer / 0 Strona: 1

Generator testów Bioinformatyka wer / 0 Strona: 1 Przedmiot: Nazwa przedmiotu Nazwa testu: Bioinformatyka wer. 1.0.6 Nr testu 0 Klasa: V zaoczne WNB UZ Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Analiza porównawcza białek zwykle zaczyna się na badaniach

Bardziej szczegółowo

Homologia, podobieństwo i analogia

Homologia, podobieństwo i analogia Porównywanie sekwencji Homologia, podobieństwo i analogia Homologi Ortologi homologiczne geny, których rozdzielenie nastąpiło na skutek specjacji, czyli rozdzielenia gatunków, lub rzadziej horyzontalnego

Bardziej szczegółowo

Motywy i podobieństwo

Motywy i podobieństwo Motywy i podobieństwo Całość funkcja Modularna budowa białek Elementy składowe czyli miejsca wiązania, domeny 1 Motywy Motyw jest opisem określonej części trójwymiarowej struktury zawierającym charakterystyczny

Bardziej szczegółowo

dopasowanie sekwencji Porównywanie sekwencji Etapy dopasowywania sekwencji Homologia, podobieństwo i analogia

dopasowanie sekwencji Porównywanie sekwencji Etapy dopasowywania sekwencji Homologia, podobieństwo i analogia Porównywanie sekwencji Homologia, podobieństwo i analogia dopasowanie sekwencji Dopasowanie/porównywanie Uliniowienie Alignment W bioinformatyce, dopasowanie sekwencji jest sposobem dopasowania struktur

Bardziej szczegółowo

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji. Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie

Bardziej szczegółowo

Dopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl

Dopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl Dopasowanie sekwencji c.d. Sequence alignment Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl Dopasowanie sekwencji - znaczenie Podobieństwo porównywanych sekwencji (similarity) może świadczyć

Bardziej szczegółowo

Dopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl

Dopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl Dopasowanie sekwencji c.d. Sequence alignment Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl dopasowanie - metody dopasowanie par sekwencji: Macierz punktów - dot matrix, dotplot Programowanie

Bardziej szczegółowo

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski Genomika Porównawcza Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski 1 Plan prezentacji 1. Rodzaje i budowa drzew filogenetycznych 2. Metody ukorzeniania drzewa

Bardziej szczegółowo

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański BIOINFORMATYKA edycja 2016 / 2017 wykład 11 RNA dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Rola i rodzaje RNA 2. Oddziaływania wewnątrzcząsteczkowe i struktury

Bardziej szczegółowo

Bioinformatyka II Modelowanie struktury białek

Bioinformatyka II Modelowanie struktury białek Bioinformatyka II Modelowanie struktury białek 1. Który spośród wymienionych szablonów wybierzesz do modelowania? Dlaczego? Struktura krystaliczną czy NMR (to samo białko, ta sama rozdzielczość)? Strukturę

Bardziej szczegółowo

Zmienność ewolucyjna. Ewolucja molekularna

Zmienność ewolucyjna. Ewolucja molekularna Zmienność ewolucyjna Ewolucja molekularna Mechanizmy ewolucji Generujące zmienność mutacje rearanżacje genomu horyzontalny transfer genów! Działające na warianty wytworzone przez zmienność dobór naturalny

Bardziej szczegółowo

Mechanizmy zmienności ewolucyjnej. Podstawy ewolucji molekularnej.

Mechanizmy zmienności ewolucyjnej. Podstawy ewolucji molekularnej. Mechanizmy zmienności ewolucyjnej Podstawy ewolucji molekularnej. Mechanizmy ewolucji } Generujące zmienność } mutacje } rearanżacje genomu } horyzontalny transfer genów } Działające na warianty wytworzone

Bardziej szczegółowo

MultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński

MultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński MultiSETTER: web server for multiple RNA structure comparison Sandra Sobierajska Uniwersytet Jagielloński Wprowadzenie Budowa RNA: - struktura pierwszorzędowa sekwencja nukleotydów w łańcuchu: A, U, G,

Bardziej szczegółowo

Generator testów bioinformatyka wer / Strona: 1

Generator testów bioinformatyka wer / Strona: 1 Przedmiot: wyklad monograficzny Nazwa testu: bioinformatyka wer. 1.0.6 Nr testu 10469906 Klasa: 5 IBOS Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Aminokwas jest to związek organiczny zawierający A) grupę

Bardziej szczegółowo

Bioinformatyka. z sylabusu...

Bioinformatyka. z sylabusu... Bioinformatyka Wykład 1. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas z sylabusu... Wykład 1, 2008 1 Co to jest Bioinformatyka? Zastosowanie technologii informacji do

Bardziej szczegółowo

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Zmiany genetyczne w ewolucji } Mutacje } tworzą nowe allele genów } Inwersje } zmieniają układ genów na chromosomach } mogą uniemożliwić rekombinację

Bardziej szczegółowo

Algorytmy kombinatoryczne w bioinformatyce

Algorytmy kombinatoryczne w bioinformatyce lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie

Bardziej szczegółowo

Analizy filogenetyczne

Analizy filogenetyczne BIOINFORMATYKA edycja 2016 / 2017 wykład 6 Analizy filogenetyczne dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Cele i zastosowania 2. Podstawy ewolucyjne

Bardziej szczegółowo

Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją).

Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją). Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją). Czym jest życie? metabolizm + informacja (replikacja) 2 Cząsteczki organiczne mog y powstać w atmosferze pierwotnej

Bardziej szczegółowo

Urszula Poziomek, doradca metodyczny w zakresie biologii Materiał dydaktyczny przygotowany na konferencję z cyklu Na miarę Nobla, 14 stycznia 2010 r.

Urszula Poziomek, doradca metodyczny w zakresie biologii Materiał dydaktyczny przygotowany na konferencję z cyklu Na miarę Nobla, 14 stycznia 2010 r. Ćwiczenie 1 1 Wstęp Rozważając możliwe powiązania filogenetyczne gatunków, systematyka porównuje dane molekularne. Najskuteczniejszym sposobem badania i weryfikacji różnych hipotez filogenetycznych jest

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Filogenetyka molekularna wykorzystuje informację zawartą w sekwencjach aminokwasów lub nukleotydów do kontrukcji drzew

Bardziej szczegółowo

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*

Bardziej szczegółowo

Acknowledgement. Drzewa filogenetyczne

Acknowledgement. Drzewa filogenetyczne Wykład 8 Drzewa Filogenetyczne Lokalizacja genów Some figures from: Acknowledgement M. Zvelebil, J.O. Baum, Introduction to Bioinformatics, Garland Science 2008 Tradycyjne drzewa pokrewieństwa Drzewa oparte

Bardziej szczegółowo

Bioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d.

Bioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d. Bioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 11.01.11 1 Dopasowanie strukturalne (alignment) odległość: d ij = (x i -x J ) 2 + (y i -y J ) 2

Bardziej szczegółowo

MSA i analizy filogenetyczne

MSA i analizy filogenetyczne Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański MSA i analizy filogenetyczne 1. Dopasowania wielosekwencyjne - wprowadzenie Dopasowanie wielosekwencyjne

Bardziej szczegółowo

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Zmiany genetyczne w ewolucji Mutacje tworzą nowe allele genów Inwersje zmieniają układ genów na chromosomach mogą uniemożliwić rekombinację

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecność Literatura, materiały Bioinformatyka i ewolucja

Bardziej szczegółowo

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Egzamin: 29.01.2018 16:00, sala 9B Pierwsza synteza Ewolucja jako zmiany częstości alleli w populacji Mutacje jako źródło nowych alleli Dobór

Bardziej szczegółowo

Bioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee

Bioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee Bioinformatyka 2 (BT172) Wykład 5 Progresywne metody wyznaczania MSA: T-coffee Krzysztof Murzyn 14.XI.2005 PLAN WYKŁADU Ostatnio : definicje, zastosowania MSA, złożoność obliczeniowa algorytmu wyznaczania

Bardziej szczegółowo

Bioinformatyka: Wykład 2. Algorytm Smitha Watermana implementacja w języku Python

Bioinformatyka: Wykład 2. Algorytm Smitha Watermana implementacja w języku Python Bioinformatyka: Wykład 2 Algorytm Smitha Watermana implementacja w języku Python Przyrównanie sekwencji Algorytm Smitha-Watermana dla pary sekwencji P i Q o długościach odpowiednio M i N. Zbuduj macierz

Bardziej szczegółowo

Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej

Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej Specjacja } Pojawienie się bariery reprodukcyjnej między populacjami dające początek gatunkom } Specjacja allopatryczna

Bardziej szczegółowo

Bioinformatyka wykład 3.I.2008

Bioinformatyka wykład 3.I.2008 Bioinformatyka wykład 3.I.2008 Białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 2008-01-03 1 Plan wykładu analiza i porównywanie struktur białek. doświadczalne metody badania struktur

Bardziej szczegółowo

Bioinformatyka wykład 8, 27.XI.2012

Bioinformatyka wykład 8, 27.XI.2012 Bioinformatyka wykład 8, 27.XI.2012 białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 2013-01-21 1 Plan wykładu regiony nieuporządkowane sposoby przedstawienia struktur białkowych powierzchnia

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecnośd Literatura, materiały i ewolucja molekularna

Bardziej szczegółowo

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST. Ćwiczenie 5/6 Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST. Prof. dr hab. Roman Zieliński 1. Informacja genetyczna u

Bardziej szczegółowo

Algorytmy kombinatoryczne w bioinformatyce

Algorytmy kombinatoryczne w bioinformatyce lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie

Bardziej szczegółowo

Ewolucja informacji genetycznej

Ewolucja informacji genetycznej 1 Ewolucja informacji genetycznej Czym jest życie? metabolizm + informacja (replikacja) Cząsteczki organiczne mog y powstać w atmosferze pierwotnej Ziemi Oparin, Haldane Miller, 1953 Co by o najpierw?

Bardziej szczegółowo

D: Dopasowanie sekwencji. Programowanie dynamiczne

D: Dopasowanie sekwencji. Programowanie dynamiczne D: Dopasowanie sekwencji. Programowanie dynamiczne Problem: jak porównywać sekwencje DNA? Czy te sekwencje są podobne? Jeśli są podobne, to jak mierzyć to podobieństwo? Odpowiedzi są kluczowe dla konstrukcji

Bardziej szczegółowo

Badanie doboru naturalnego na poziomie molekularnym

Badanie doboru naturalnego na poziomie molekularnym Badanie doboru naturalnego na poziomie molekularnym Podstawy ewolucji molekulanej Jak ewoluują sekwencje Zmiany genetyczne w ewolucji Mutacje tworzą nowe allele genów Inwersje zmieniają układ genów na

Bardziej szczegółowo

3 Przeszukiwanie baz danych

3 Przeszukiwanie baz danych Spis treści 3 Przeszukiwanie baz danych 1 3.1 Heurystyczne algorytmy...................... 1 3.1.1 FASTA........................... 1 3.1.2 BLAST........................... 3 3.2 Macierze substytucyjne.......................

Bardziej szczegółowo

Bioinformatyka II Modelowanie struktury białek

Bioinformatyka II Modelowanie struktury białek Bioinformatyka II Modelowanie struktury białek 1. Który spośród wymienionych szablonów wybierzesz do modelowania dla każdego z podanych przypadków? Dlaczego? Struktura krystaliczną czy NMR (to samo białko,

Bardziej szczegółowo

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*

Bardziej szczegółowo

Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz

Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz Ewolucja molekularna człowieka okiem bioinformatyka Justyna Wojtczak Jarosław Jeleniewicz Informatyka w biologii - bioinformatyka Jest to szeroka dziedzina zajmująca się tworzeniem zaawansowanych baz danych,

Bardziej szczegółowo

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek

Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Podręczniki Populacja Grupa krzyżujących się ze sobą osobników oraz ich potomstwo Zbiór wszystkich alleli populacji pula genowa Najprostszy

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA

PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa - przykłady 4. Etapy konstrukcji drzewa

Bardziej szczegółowo

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II 10 października 2013: Elementarz biologii molekularnej www.bioalgorithms.info Wykład nr 2 BIOINFORMATYKA rok II Komórka: strukturalna i funkcjonalne jednostka organizmu żywego Jądro komórkowe: chroniona

Bardziej szczegółowo

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja. Podstawy biologii Informacja genetyczna. Co to jest ewolucja. Materiał genetyczny Materiałem genetycznym są kwasy nukleinowe Materiałem genetycznym organizmów komórkowych jest kwas deoksyrybonukleinowy

Bardziej szczegółowo

Nuttall przeprowadził testy precypitacyjne białek surowicy, aby wykazać związek filogenetyczny między różnymi grupami zwierząt.

Nuttall przeprowadził testy precypitacyjne białek surowicy, aby wykazać związek filogenetyczny między różnymi grupami zwierząt. 1904 Nuttall przeprowadził testy precypitacyjne białek surowicy, aby wykazać związek filogenetyczny między różnymi grupami zwierząt. M. Prakash 2007.Encyclopaedia of Gene Evolution Vol. 2, Molecular Genetics,

Bardziej szczegółowo

Definicja pliku kratowego

Definicja pliku kratowego Pliki kratowe Definicja pliku kratowego Plik kratowy (ang grid file) jest strukturą wspierająca realizację zapytań wielowymiarowych Uporządkowanie rekordów, zawierających dane wielowymiarowe w pliku kratowym,

Bardziej szczegółowo

Porównywanie sekwencji białek i kwasów nukleinowych

Porównywanie sekwencji białek i kwasów nukleinowych Porównywanie sekwencji białek i kwasów nukleinowych Krzysztof Lewiński 1. Podobieństwo i jego miara Wprawdzie podobieństwo jest pojęciem często używanym w życiu codziennym ale nie oznacza to, że możemy

Bardziej szczegółowo

Filogenetyka molekularna I

Filogenetyka molekularna I 2 Literatura Krzysztof Spalik, Marcin Piwczyński (2009), Rekonstrukcja filogenezy i wnioskowanie filogenetyczne w badaniach ewolucyjnych, Kosmos 58(3-4): 485-498 Filogenetyka molekularna I John C. Avise

Bardziej szczegółowo

Filogenetyka molekularna. Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji

Filogenetyka molekularna. Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji Filogenetyka molekularna Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji Co to jest filogeneza? Filogeneza=drzewo filogenetyczne=drzewo rodowe=drzewo to rozgałęziający się diagram, który

Bardziej szczegółowo

Budowa aminokwasów i białek

Budowa aminokwasów i białek Biofizyka Ćwiczenia 1. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas Budowa aminokwasów i białek E.Banachowicz 1 Ogólna budowa aminokwasów α w neutralnym p α N 2 COO N

Bardziej szczegółowo

Ewolucja informacji genetycznej

Ewolucja informacji genetycznej 1 Ewolucja informacji genetycznej Czym jest życie? metabolizm + informacja (replikacja) Cząsteczki organiczne mogły powstać w atmosferze pierwotnej Ziemi Oparin, Haldane Miller, 1953 Co było najpierw?

Bardziej szczegółowo

MACIERZE MUTACYJNE W ANALIZIE GENOMÓW czy możliwa jest rekonstrukcja filogenetyczna? Aleksandra Nowicka

MACIERZE MUTACYJNE W ANALIZIE GENOMÓW czy możliwa jest rekonstrukcja filogenetyczna? Aleksandra Nowicka MAIERZE MUTAYJNE W ANALIZIE GENOMÓW czy możliwa jest rekonstrukcja filogenetyczna? Aleksandra Nowicka Zadaniem FILOGENETYKI jest : zrekonstruowanie ewolucyjnej historii wszystkich organizmów odkrycie przodka

Bardziej szczegółowo

Bioinformatyka wykład 9

Bioinformatyka wykład 9 Bioinformatyka wykład 9 14.XII.21 białkowa bioinformatyka strukturalna krzysztof_pawlowski@sggw.pl 211-1-17 1 Plan wykładu struktury białek dlaczego? struktury białek geometria i fizyka modyfikacje kowalencyjne

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova M. Czoków, J. Piersa 2010-12-21 1 Definicja Własności Losowanie z rozkładu dyskretnego 2 3 Łańcuch Markova Definicja Własności Losowanie z rozkładu

Bardziej szczegółowo

BUDOWA I FUNKCJA GENOMU LUDZKIEGO

BUDOWA I FUNKCJA GENOMU LUDZKIEGO BUDOWA I FUNKCJA GENOMU LUDZKIEGO Magdalena Mayer Katedra i Zakład Genetyki Medycznej UM w Poznaniu 1. Projekt poznania genomu człowieka: Cele programu: - skonstruowanie szczegółowych map fizycznych i

Bardziej szczegółowo

Zmienność ewolucyjna. Ewolucja molekularna

Zmienność ewolucyjna. Ewolucja molekularna Zmienność ewolucyjna Ewolucja molekularna Mechanizmy ewolucji Generujące zmienność mutacje rearanżacje genomu horyzontalny transfer genów Działające na warianty wytworzone przez zmienność dobór naturalny

Bardziej szczegółowo

Zmienność ewolucyjna. Ewolucja molekularna

Zmienność ewolucyjna. Ewolucja molekularna Zmienność ewolucyjna Ewolucja molekularna Mechanizmy ewolucji Generujące zmienność mutacje rearanżacje genomu horyzontalny transfer genów Działające na warianty wytworzone przez zmienność dobór naturalny

Bardziej szczegółowo

Hierarchiczna analiza skupień

Hierarchiczna analiza skupień Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa M. Czoków, J. Piersa 2012-01-10 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego 3 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego

Bardziej szczegółowo

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19 WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19 Witold Dyrka 14 marca 2019 1 Wprowadzenie 1.1 Definicje bioinformatyki Według polskiej Wikipedii [1], Bioinformatyka interdyscyplinarna dziedzina

Bardziej szczegółowo

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja. Podstawy biologii Informacja genetyczna. Co to jest ewolucja. Zarys biologii molekularnej genu Podstawowe procesy genetyczne Replikacja powielanie informacji Ekspresja wyrażanie (realizowanie funkcji)

Bardziej szczegółowo