Porównywanie sekwencji białkowych
|
|
- Danuta Mazur
- 6 lat temu
- Przeglądów:
Transkrypt
1 Bioinformatyka -9 Bioinformatyka Wykład 4. E. Banachowicz Zakład Biofizyki Molekularnej Porównywanie sekwencji białkowych Wykład 4,
2 Bioinformatyka -9 Porównywanie sekwencji elem porównania białek jest między innymi przypisanie informacji znanej dla jednej cząsteczki drugiej cząsteczce (genomika/proteomika porównawcza) DN RN białko sekwencja struktura funkcja Porównywanie sekwencji Pierwsze pytanie biologa molekularnego, kiedy odkryje nową sekwencję: zy w bazie sekwencji są już sekwencje podobne? Sekwencje są identyczne nic nowego. Sekwencja jest podobna (ma krewnych ) nowy członek znanej rodziny Sekwencja ma kilka podobnych regionów, motywów lub domen można zaproponować funkcję Nie ma znaczącego podobieństwa dużo pracy.. Wykład 4,
3 Bioinformatyka -9 Identyfikacja sekwencji w BD Identyfikacja przez porównanie z innymi sekwencjami Zestawienia sekwencji = uliniowienie = =porównanie = alignment Identyfikacja sekwencji i jej funkcji Białka spokrewnione ze sobą (posiadające wspólnego przodka) mają podobne sekwencje, strukturę i funkcję Pewne istotne fragmenty (motywy) są konserwatywne i charakteryzują rodzinę białek (Bazy rodzin białkowych: PROSIE, PRINS, InterPro) Wykład 4,
4 Bioinformatyka -9 Identyfikacja sekwencji i jej funkcji? czy wszystkie białka spokrewnione mają tę samą funkcję?? czy podobieństwo krótkich fragmentów może być przypadkowe?? czy wszystkie białka pełniące tę samą funkcje muszą być spokrewnione? Ewolucyjne podstawy porównywania sekwencji Nic w Biologii (Bioinformatyce) nie ma sensu jeśli rozpatruje się to w oderwaniu od ewolucji. heodosis Dobzhansky (9975) Wykład 4, 4
5 Bioinformatyka -9 homologia/homoplazja homologia -podobieństwo ze względu na wspólnego przodka (dywergencja) homoplazja podobieństwo ze względu na konwergencję Homologia Podobieństwo Sekwencje homologiczne są podobne Sekwencje podobne nie muszą być homologiczne! Homologia = wspólny przodek Wykład 4, 5
6 Bioinformatyka -9 Homologi Hemoglobina (łańcuch α) Mioglobina Leghemoglobina hemoglobina, mioglobina i leghemoglobina Zachowawczość struktury przestrzennej Wykład 4, 6
7 Bioinformatyka -9 czas Rodziny Homologi Drzewo ewolucyjne globin. homologi: ortologi -różne gatunki, taka sama funkcja (specjacja) paralogi-podobna funkcja, ale ewoluowały niezależnie (duplikacja,ten sam organizm) analogi: różne sekwencje, różne motywy, ale identyczna orientacja ważnych aminokwasów prymitywna, pierwotna globina wiążąca tlen Molecular ell Biology,4ed. Lodish, Berk, Matsudaira, Kaiser, Krieger, Scott, Zipursky, and Darnell Wykład 4, 7
8 Bioinformatyka -9 Ortologi duplikacja oryginalny gen duplikacja specjacja b gatunek b,c,a c gen b b b gen a a a t t t gatunek b,a Homologi: paralogi (wspólny przodek w czasie duplikacji) ortologi (wspólny przodek w czasie specjacji: a-a) krowa Rodzina - homologi Rybonukleaza wołowa (enzym trawienny) człowiek Paralogi Rybonukleaza ludzka (enzym trawienny) angiogenina ludzka (stymuluje wzrost naczyń krwionośnych) (Biochemistry, J.Berg, J.ymoczko, L.Stryer.,PWN 5). Wykład 4, 8
9 Bioinformatyka -9 Dlaczego homologia jest ważna? homologia sugeruje wspólną strukturę i funkcję Homologia podobne funkcje, konserwatywność fragmentów rypsyna (myszy) P746 i trypsyna (langusty) P765 Wykład 4, 9
10 Bioinformatyka -9 S-S S-S S-S Składowa centrum aktywnego, odpowiedzialna za specyficzność substratową Układ przeniesienia ładunku Porównaj z: ezx.pdb, M9U P765 P746 Wykład 4,
11 Bioinformatyka -9 Homologia podobne funkcje a4v.pdb 5lyz.pdb nalogi Izomeraza triozofosforanowa (E 5...),4 - beta Ksylanaza Wykład 4,
12 Bioinformatyka -9 nalogi His57, sp, Ser95 His64, sp, Ser proteazy serynowe hydrolizujące wiązanie peptydowe Modele ewolucji Wykład 4,
13 Bioinformatyka -9 Modele ewolucji zy gen człowieka jest bardziej podobny do genu szympansa czy goryla? Potrzebny jest ilościowy model ewolucji. Np. wyznaczenie dopasowania sekwencji i obliczenie odsetka pozycji, na których wystąpiły różnice. Punktacja obszar dopasowania MGQKLMRVRVEGGPEVLKLRSDIVPIPKDHQVLI VRVEGPEVLRISDIVPIPKDHQVLIEIRSGS dopasowanie przerwa niedopasowanie S punktacja za dopasowanie Score = Max(S) S = (dopasowania) - (niedopasowania) - (przerwy) Wykład 4,
14 Bioinformatyka -9 liczba identycznych aminokwasów Jakość dopasowania globalnego Dla dopasowań globalnych: porównanie obliczonej wartości dla danego dopasowania z wartościami obliczonymi dla wielu dopasowań przypadkowych sekwencji o podobnym składzie i długości przykład: dopasowanie sekwencji α hemoglobiny ludzkiej i mioglobiny ludzkiej identyczne aminokwasy identyczne aminokwasy wszystkie możliwe zestawienia sekwencji, zliczanie identycznych dopasowanie Wykład 4, 4
15 Bioinformatyka -9 Jakość dopasowań zestawienia sekwencji z przerwami, zliczanie identycznych 8 identyczne aminokwasy we fragmencie o długości % identycznych aminokwasów. zy jest to znaczące podobieństwo? S = (dopasowania) - (niedopasowania) - (przerwy) Jakość dopasowań Dla dopasowań globalnych: - porównanie obliczonej wartości dla danego dopasowania z wartościami obliczonymi dla wielu dopasowań przypadkowych sekwencji o podobnym składzie i długości przypadkowe sekwencje o podobnym składzie: sekwencja jednego z białek zostaje wielokrotnie potasowna Wykład 4, 5
16 Bioinformatyka -9 liczba przyrównań Jakość dopasowań punktacja: tożsamość: + przerwa: 5 S = (dopasowania) - (przerwy) szansa uzyskania takiego odchylenia w przypadkowej punktacja sekwencji przyrównania wynosi : hemoglobina α i mioglobiny punktacja przyrównania Modele ewolucji sekwencji białkowej PM (point accepted mutations = punktowe mutacje utrwalone) macierz uwzględniająca tempo i typ możliwych podstawień aminokwasowych. Wykład 4, 6
17 Bioinformatyka -9 Wykład 4, 7 Macierz PM5 wartości w macierzy są proporcjonalne do logarytmu z (cz. docelowej/cz.tła) zbudowana na podstawie analizy par blisko spokrewnionych (PM) i ekstrapolowana do 5PM ekstrapolacje można przeprowadzić dla różnych odległości ewolucyjnych PM duże PM stosuje się do porównywania sekwencji o dużym stopniu dywergencji ewolucyjnej małe PM do badania sekwencji podobnych P 6 S W V 4 4 B Z X R N D Q E G H I L K M P S W V B Z X N D Q 4 E 4-7 G 5-7 H 6 I 5 4 L 6 4 K 5 M Dayhoff PM 5 Matrix R 6
18 Bioinformatyka -9 Wykład 4, 8 zestawienie białek wysoka punktacja oznacza: -> podstawienia są częste + -> podstawienia są częste tam gdzie jest utrwalone tam gdzie jest utrwalone P 6 S W V 4 4 B Z X R N D Q E G H I L K M P S W V B Z X N D Q 4 E 4-7 G 5-7 H 6 I 5 4 L 6 4 K 5 M R 6 Dayhoff PM 5 Matrix
19 Bioinformatyka -9 Wykład 4, 9 Pierwotne białko zestawieni sekwencji wysoka punktacja W W oznacza : inne podstawienia nie są możliwe tam gdzie W jest utrwalone W W W W W W W W W W W W W W W W W W W P 6 S W V 4 4 B Z X R N D Q E G H I L K M P S W V B Z X N D Q 4 E 4-7 G 5-7 H 6 I 5 4 L 6 4 K 5 M R 6 Dayhoff PM 5 Matrix
20 Bioinformatyka -9 skład aminokwasowy białek {rgos and Mcaldon} lanina jest bardzo pospolita minokwasy % 8..7 D 5. E 6..9 G 7. H. I 5. K 5.7 L 9. M.4 N 4.4 P 5. Q 4. R 5.7 S V 6.6 W.. ryptofan jest bardzo rzadki Małe, polarne Macierz PM5 S, Ser, hr Małe, hydrofobowe V,Val I,Ile Duże, naładowane R, rg K, Lys Wykład 4,
21 Bioinformatyka -9 Macierze BLOSUM Powstały w oparciu o bazę BLOKS dopasowanie sekwencji daleko spokrewnionych (oszacowanie częstotliwości docelowych, bez modelu ewolucyjnego) Rodzina macierzy: różnice (indeksu) związane są z maksymalnym stopniem identyczności sekwencji wziętych do obliczeń BLOSUM6 BLOSUM9 do analizy sekwencji blisko spokrewnionych BOLSUM do analizy odległych ewolucyjnie sekwencji Wykład 4,
22 Bioinformatyka -9 Reprezentacja macierzy BLOSUM 6 DEHKR naładowane NQS polarne GP hydrofobowe ILMVW duże i hydrofobowe Biochemistry, Berg, Jeremy M.; ymoczko, John L.; and Stryer, Lubert. New ork: W. H. reeman and o.; (), Rys.7.9 Statystyczne znaczenie dopasowań jaka jest wartość/ istotność dopasowania? Jaka jest wartość świadczy o homologii, a jaka o przypadkowym podobieństwie? Wykład 4,
23 Bioinformatyka -9 z macierzami substytucji Jakość dopasowań punktacja: BLOSUM6 otwarcie przerwy: wydłużenie przerwy: identyczne podobne = substytucje konserwatywne S = (dopasowania) - (niedopasowania) - (przerwy) z macierzami substytucji pozwala wykryć homologię białek pokrewnych w mniejszym stopniu Jakość dopasowań punktacja: BLOSUM6 otwarcie przerwy: wydłużenie przerwy: Mioglobina ludzka Leghemoglobina z łubinu identyczność: % S = (dopasowania) - (niedopasowania) - (przerwy) Wykład 4,
24 Bioinformatyka -9 liczba przyrównań liczba przyrównań Jakość dopasowań Mioglobina ludzka Leghemoglobina z łubinu punktacja przyrównania (tylko identyczne) punktacja przyrównania (BLOSUM6) () punktacja oparta o identyczność -szansa dopasowanie tylko na zasadzie przypadku : (B) punktacja oparta o konserwatywne substytucje - szansa dopasowanie tylko na zasadzie przypadku : Jakość dopasowania Dla sekwencji dłuższych niż aminokwasów identyczność wyższa niż 5% prawie na pewno nie jest przypadkowa prawdopodobieństwo homologii identyczność niższa niż 5% mało prawdopodobne, żeby podobieństwo było statystycznie istotne Brak statystycznej istotności nie wyklucza homologii Wykład 4, 4
25 Bioinformatyka -9 hemoglobina, mioglobina i leghemoglobina Zachowawczość struktury przestrzennej α hemoglobina (homo sapiens) P6995 (Expasy) mioglobina (homo sapiens) P44 (Expasy) leghemoglobina (łubin) P9 (Expasy) EMBOSS Pairwise lignment lgorithms Wykład 4, 5
26 Bioinformatyka -9 Global alignment SIM P44, P6995 Wykład 4, 6
27 Bioinformatyka -9 Jakość dopasowania lokalnego () unkcja gęstości prawdopodobieństwa = rozkład wartości granicznej E(S) rozkład spodziewanych dopasowań, które mają wartość przynajmniej równą S E (S) = K m n exp(-λs) Statystyczne znaczenie dopasowań jaka jest wartość/ istotność dopasowania? Dla dopasowań globalnych: porównanie obliczonej wartości dla danego dopasowania z wartościami obliczonymi dla wielu dopasowań przypadkowych sekwencji o podobnym składzie i długości Wykład 4, 7
28 Bioinformatyka -9 E (S) = K m n exp -λs Expected value, wartość oczekiwana sekwencji mających wartość co najmniej S S bit score, punktacja podobieństwa m range of alignment, długość porównywanego segmentu n wielkość bazy λ - określa wpływ systemu punktowania K liczba powtarzających się segmentów w przeszukiwanej sekwencji Bit Score unormowany score, wartość uniezależniona od długości sekwencji Dopasowanie sekwencji Wykład 4, 8
29 Bioinformatyka -9 lgorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne (BLS, S) metody statystyczne (modele Markova, statystyka Bayesa) Rodzaje dopasowań pokrycie sekwencji globalne, lokalne liczba sekwencji porównywanych para (pairwise sequence alignment) więcej niż dwie (multiple sequences alignment) Pokrycie sekwencji dopasowanie globalne dopasowanie wzdłuż całej sekwencji (zastosowanie: do białek składających się z pojedynczej domeny lub homologicznych słabo zróżnicowanych) dopasowanie lokalne uwzględnia domenową naturę białek, szuka subsekwencji (zastosowanie: do białek wielodomenowych, mrn z sekwencją genomową) 59 Wykład 4, 9
30 Bioinformatyka -9 Liniowe zestawienie dwóch sekwencji Pairwise Sequence lignment sekwencja BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER sekwencja Ogólne spojrzenie na problem laresansom BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER Wykład 4,
31 Bioinformatyka -9 BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER Wykład 4,
32 Bioinformatyka -9 BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER Wykład 4,
33 Bioinformatyka -9 Insercja/Delecja => GPS zestawienie jeden-do-jeden przerwy odzwierciedlają wydarzenia ewolucyjne (wyzwanie dla programistów) BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER laresansom Wykład 4,
34 Bioinformatyka -9 Insercja/Delecja => GPS BEERGLEDILGERGSOUWERM BEERN-LEDLGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS BEERGLEDILGERGSOUWERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Wykład 4, 4
35 Bioinformatyka -9 Insercja/Delecja => GPS BEERGLEDILGERG-SOUWERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS BEERGLEDILGERG--SOUWERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Wykład 4, 5
36 Bioinformatyka -9 Insercja/Delecja => GPS BEERGLEDILGERG---SOUWERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS BEERGLEDILGERG---SOU-WERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Wykład 4, 6
37 Bioinformatyka -9 Insercja/Delecja => GPS BEERGLEDILGERG---SOU--WERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS G<->W = -7 G<->G = +5 BEERGLEDILGER-G--SOU--WERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Wykład 4, 7
38 Bioinformatyka -9 Insercja/Delecja => GPS G<->W = -7 G<->G = +5 BEERGLEDILGER-G--SOU--WERM -BEERN-LED-LGERDWGLSOUWRRWER <-> = <-> = + laresansom Macierze punktowe (DotPlot) Macierze DotPlot opierają się na ocenie wizualnej i czasami skuteczniejsze niż alignment wykrywają fragmenty powtarzające się, rearanżacje i podobieństawa lokalne Dotter: Wykład 4, 8
39 Bioinformatyka -9 H I S S E Q E N E H I S S E Q E N E Dotter niektóre układy punktów tworzą ścieżkę każda ścieżka odpowiada jednemu dopasowaniu M S E Q U E N E H I S S E Q E N E M S E Q U E N E H I S S E Q E N E znaleźć najlepszą ścieżkę! M S E Q U E N E Dotter kropka w miejscu dopasowania układ kropek tworzy ścieżkę M S E Q U E N E H I S S E Q E N E M S E Q U E N E H I S S E Q E N E zy wprowadzenie przerwy da lepsze dopasowanie? M S E Q U E N E Wykład 4, 9
40 Bioinformatyka -9 H I S S E Q E N E Dotter wprowadzenie przerwy wydłużenie ścieżki M S E Q U E N E H I S S E Q E N E M S E Q U E N E H I S S E Q E N E M S E Q U E N E M S E Q U E N E H I S S E Q - E N E Najlepsza ścieżka? G G Wykład 4, 4
41 Bioinformatyka -9 Najlepsza ścieżka? G G każda ścieżka odpowiada jakiemuś dopasowaniu która z nich jest optymalna? Najlepsza ścieżka Madryt Poznań optymalna? najszybsza? najkrótsza? Wykład 4, 4
42 Bioinformatyka -9 Najlepsza ścieżka najlepsza ścieżka = Zestawienia sekwencji zależy od sposobu punktowania. tożsamości, podobieństwa, przerwy Wartości substytucji i kary za przerwy schemat wartościowania I: (match) dopasowany: + (mismatch) niedopasowany: (gap) przerwa: (nie-afiniczne kary za przerwy każda przerwa traktowana jest tak samo) schemat wartościowania II: dopasowany: + niedopasowany: otwarcie przerwy: G przedłużenie przerwy: L (afiniczne kary za przerwy kara za otwarcie, kary za przedłużenie ) Wykład 4, 4
43 Bioinformatyka -9 Punktacja obszar dopasowania GGGGGGG GGGG-GGGGG dopasowanie przerwa niedopasowanie S punktacja za dopasowanie Score = Max(S) S = (dopasowania) - (niedopasowania) - (przerwy) Punktowanie przerw non-affine model (nieafinicznie): równo (match:4, mismatch:, gap:) affine model (afinicznie): G + L n (match:4, mismatch:, gap creation:-8, gap:) GGG------G GGGGG : :7 GGG------G GGGGG : : G 4 4 G Wykład 4, 4
44 Bioinformatyka -9 DotPlot -metody najprościej: kropka w miejscu identycznych znaków w sekwencjach lepiej: zastosowanie tablicy podobieństw (macierzy substytucji) kropka w miejscu, gdzie wartość podobieństwa przekracza określoną wartość lepiej: porównywanie okienek wstawianie kropek tam, gdzie ciąg n-liter ma punktację większą niż pewna wartość, albo jest określona liczba identycznych liter jeszcze lepiej: odfiltrowanie mniej istotnych kropek DotPlot najprostsza metoda W. Makałowski, 5 Wykład 4, 44
45 Bioinformatyka -9 DotPlot najprostsza metoda DotPlot metoda okienkowa obliczyć punktację w okienku o zadanym rozmiarze (window size) ocenić czy punktacja spełnia określone warunki (threshold) przesunąć okienko o zadany krok (step) Wykład 4, 45
46 Bioinformatyka -9 DotPlot metoda okienkowa kropka= x brak kropki= o window size: 9 threshold: 6 step: DotPlot metoda okienkowa window size: 9 threshold: step: 6 Wykład 4, 46
47 Bioinformatyka -9 DotPlot metoda okienkowa window size: 9 threshold: step: 6 DotPlot metoda okienkowa window size: 9 threshold: step: 6 Wykład 4, 47
48 Bioinformatyka -9 DotPlot metoda okienkowa window size: 9 threshold: step: 6 Programowanie dynamiczne najlepsza ścieżka schemat wartościowania I: (match) dopasowany: + (mismatch) niedopasowany: (gap) przerwa: (nie-afiniczne kary za przerwy każda przerwa traktowana jest tak samo) G G Wykład 4, 48
49 Bioinformatyka -9 Programowanie dynamiczne zasady: G G dopasowane z = dopasowane z = + NULL dopasowane z = dopasowane z NULL = Programowanie dynamiczne G G + Wykład 4, 49
50 Bioinformatyka -9 Programowanie dynamiczne G G + stopniowe poszerzanie ścieżek Programowanie dynamiczne G G + + stopniowe poszerzanie ścieżek Wykład 4, 5
51 Bioinformatyka -9 Programowanie dynamiczne G G + + stopniowe poszerzanie ścieżek Programowanie dynamiczne G G stopniowe poszerzanie ścieżek Wykład 4, 5
52 Bioinformatyka -9 Programowanie dynamiczne G G stopniowe poszerzanie ścieżek wszystkie punkty musza zostać zbadane Programowanie dynamiczne G G stopniowe poszerzanie ścieżek Wykład 4, 5
53 Bioinformatyka -9 Programowanie dynamiczne G G stopniowe poszerzanie ścieżek G- G Programowanie dynamiczne G G stopniowe poszerzanie ścieżek G- G Wykład 4, 5
54 Bioinformatyka -9 G G G lgorytm Needleman -Wunsh a znaleźć zestawienie z max score! G G macierz elementy ij powtarzaj ij = max( i,j + S( i,b j ), i,j + d, i,j + d) sekwencja B sekwencja = j = i = lgorytm Needleman -Wunsh a pseudo-code (tworzenie macierzy ): for i= to lengh() (i,) <- for j= to lengh(b) (,j) <- for i= to lengh() for j= to lengh(b) { choice <- (i,j + S((i),B(j)) choice <- (i,j) + d choice <- (i,j) + d (i,j) <- max(choice,choice,choice) } i = j = Wykład 4, 54
55 Bioinformatyka -9 lgorytm Needleman -Wunsh a ten element macierzy ma zawsze, dla każdego zestawienia najwyższą wartość Odtworzenie zestawienia sekwencji, dającego najwyższą punktację, polega na sprawdzaniu źródeł ( możliwości), z których można dotrzeć do danego punktu i,j: jeśli choice to zestawienie (i) z B(j) jeśli choice to zestawinie (i) z przerwą jeśli choise to zestawienia B(j) z przerwą lgorytm Needleman -Wunsh a pseudo-code (budowania zestawienia): lignment <- lignmentb <- i <- length() j <- length(b) while (i> ND j>) { Score <- (i,j) ScoreDiag <- (i,j) ScoreUp <- (i, j) ScoreLeft <- (i,j) if (Score S((i),B(j))==ScoreDiag { lignment <- (i)+ lignment lignmentb <- B(j)+ lignmentb i <- i j <- j } Wykład 4, 55
56 Bioinformatyka -9 lgorytm Needleman -Wunsh a Score <- (i,j) ScoreDiag <- (i,j) ScoreUp <- (i, j) ScoreLeft <- (i,j) if (Score S((i),B(j))==ScoreDiag { lignment <- (i)+ lignment lignmentb <- B(j)+ lignmentb i <- i j <- j } else if (Score == ScoreLeft d) { lignment <- (i)+ lignment lignmentb <- - + lignmentb i <- i } } while (i>=) {. lgorytm Needleman -Wunsh a else if (Score == ScoreLeft d) { lignment <- (i)+ lignment lignmentb <- - + lignmentb i <- i } otherwise (Score == ScoreUp d) { lignment <- - + lignment lignmentb <- B(j)+ lignmentb j <- j } Wykład 4, 56
57 Bioinformatyka -9 lgorytm Needleman -Wunsh a while (i>=) { lignment <- (i) + ligment lignmentb <- - + ligmentb i <- i } while (j>=) { lignment <- - + ligment lignmentb <- B(j) + ligmentb j <- j } } Podsumowanie lgorytmy porównywania sekwencji oparte na programowaniu dynamicznym gwarantują znalezienie optymalnego (najlepszego) zestawienia dwóch sekwencji wymagają dużych rezerw pamięci i czasu Wykład 4, 57
58 Bioinformatyka -9 Programowanie dynamiczne Metody dynamiczne dobre są do zestawienia (porównania) dwóch sekwencji Jeśli celem jest znalezienie sekwencji homologicznych przeszukać trzeba bazę sekwencji. Przeszukać = porównać każdą sekwencję w bazie z zadaną sekwencją (query) to może być trudne.. Metody dynamiczne są raczej powolne i wymagają pamięci (na np. zapamiętanie macierzy (nm) = O(nm)) Programowanie dynamiczne Rozmiar baz danych (rośnie ekspotencjalnie) białkowa: ok. reszt aminokwasowych nukleotydowa: nukleotydów zas pracy komputera z mocą obliczeniową 7 komórek macierzy/sekundę (pełne zestawienie metodami dynamicznymi) białko aminokwasów: 5 godzin dla bazy białkowej DN nukleotydów: 5555 godzin ( dni) w GenBanku (wg. W. Makałowskiego) Wykład 4, 58
59 Bioinformatyka -9 Koniec Wykład 4, 59
Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM
Bioinformatyka (wykład monograficzny) wykład 5. E. Banachowicz Zakład Biofizyki Molekularnej IF UM http://www.amu.edu.pl/~ewas lgorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne
Bardziej szczegółowoBioinformatyka. Porównywanie sekwencji
Bioinformatyka Wykład 5 E. Banachowicz Zakład Biofizyki Molekularnej IF UM 1 http://www.amu.edu.pl/~ewas Porównywanie sekwencji Pierwsze pytanie biologa molekularnego, kiedy odkryje nową sekwencję: zy
Bardziej szczegółowoPRZYRÓWNANIE SEKWENCJI
http://theta.edu.pl/ Podstawy Bioinformatyki III PRZYRÓWNANIE SEKWENCJI 1 Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych), które posiadają
Bardziej szczegółowoDopasowanie sekwencji (sequence alignment)
Co to jest alignment? Dopasowanie sekwencji (sequence alignment) Alignment jest sposobem dopasowania struktur pierwszorzędowych DNA, RNA lub białek do zidentyfikowanych regionów w celu określenia podobieństwa;
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów
Bardziej szczegółowoPrzyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Przyrównanie sekwencji Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych),
Bardziej szczegółowoDopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010)
Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów
Bardziej szczegółowoDopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012)
Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie
Bardziej szczegółowoDopasowania par sekwencji DNA
Dopasowania par sekwencji DNA Tworzenie uliniowień (dopasowań, tzw. alignmentów ) par sekwencji PSA Pairwise Sequence Alignment Dopasowania globalne i lokalne ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA
Bardziej szczegółowoBioinformatyka Laboratorium, 30h. Michał Bereta
Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Często dopasować chcemy nie dwie sekwencje ale kilkanaście lub więcej 2 Istnieją dokładne algorytmy, lecz są one niewydajne
Bardziej szczegółowoPorównywanie i dopasowywanie sekwencji
Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek narodziła się nowa dyscyplina nauki ewolucja molekularna Ewolucja molekularna
Bardziej szczegółowoPorównywanie i dopasowywanie sekwencji
Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek pojawiła się nowa możliwość śledzenia ewolucji na poziomie molekularnym Ewolucja
Bardziej szczegółowoPolitechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment
Dopasowywanie sekwencji Sequence alignment Drzewo filogenetyczne Kserokopiarka zadanie: skopiować 300 stron. Co może pójść źle? 2x ta sama strona Opuszczona strona Nadmiarowa pusta strona Strona do góry
Bardziej szczegółowoPrzyrównywanie sekwencji
Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański Przyrównywanie sekwencji 1. Porównywanie sekwencji wprowadzenie Sekwencje porównujemy po to, aby
Bardziej szczegółowoSpis treści 8 Ewolucja molekularna... 87. 9 Ewolucyjne podstawy porównywania sekwencji... 87. 9.1 Identyfikacja sekwencji i jej funkcji...
Spis treści 8 Ewolucja molekularna... 87 9 Ewolucyjne podstawy porównywania sekwencji... 87 9.1 Identyfikacja sekwencji i jej funkcji... 87 9.2 Homologia... 88 9.3 Modele ewolucji sekwencji białkowej...
Bardziej szczegółowoWykład 5 Dopasowywanie lokalne
Wykład 5 Dopasowywanie lokalne Dopasowanie par (sekwencji) Dopasowanie globalne C A T W A L K C A T W A L K C O W A R D C X X O X W X A X R X D X Globalne dopasowanie Schemat punktowania (uproszczony)
Bardziej szczegółowoSpis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych...
Przedmowa... XI Część pierwsza Wprowadzenie i biologiczne bazy danych 1 Wprowadzenie... 3 Czym jest bioinformatyka?... 5 Cele... 5 Zakres zainteresowań... 6 Zastosowania... 7 Ograniczenia... 8 Przyszłe
Bardziej szczegółowoDopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania
Wprowadzenie do Informatyki Biomedycznej Wykład 2: Metody dopasowywania sekwencji Wydział Informatyki PB Dopasowywanie sekwencji (ang. sequence alignment) Dopasowywanie (przyrównywanie) sekwencji polega
Bardziej szczegółowoDopasowanie par sekwencji
BIOINFORMTYK edycja 2016 / 2017 wykład 3 Dopasowanie par sekwencji dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Idea i cele dopasowania sekwencji 2. Definicje
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW
PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW DOPASOWYWANIE SEKWENCJI 1. Miary podobieństwa sekwencji aminokwasów 2. Zastosowanie programów: CLUSTAL OMEGA BLAST Copyright 2013, Joanna Szyda
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA
PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa 4. Etapy konstrukcji drzewa filogenetycznego
Bardziej szczegółowoBioinformatyka. Podsumowanie algorytmów dynamicznych
Bioinformatyka Wykład 5 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas Podsumowanie algorytmów dynamicznych Algorytmy porównywania sekwencji oparte na programowaniu dynamicznym
Bardziej szczegółowoBioinformatyka. z sylabusu... (wykład monograficzny) wykład 1. E. Banachowicz. Wykład monograficzny Bioinformatyka.
Bioinformatyka (wykład monograficzny) wykład 1. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas z sylabusu... Wykład 1, 2006 1 Co to jest Bioinformatyka? Zastosowanie technologii
Bardziej szczegółowoplezjomorfie: podobieństwa dziedziczone po dalszych przodkach (c. atawistyczna)
Podobieństwa pomiędzy organizmami - cechy homologiczne: podobieństwa wynikające z dziedziczenia - apomorfie: podobieństwa dziedziczone po najbliższym przodku lub pojawiająca się de novo (c. ewolucyjnie
Bardziej szczegółowoGenerator testów 1.3.1 Bioinformatyka_zdalne wer. 1.0.13 / 0 Strona: 1
Przedmiot: Bioinformatyka Nazwa testu: Bioinformatyka_zdalne wer. 1.0.13 Nr testu 0 Klasa: WNB UZ Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Model Markowa substytucji aminokwasów w mutagenezie białek zakłada...
Bardziej szczegółowoWykład Bioinformatyka 2012-09-24. Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki
Bioinformatyka Wykład 7 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Plan Bioinformatyka Ewolucyjne podstawy Bioinformatyki Filogenetyka Bioinformatyczne narzędzia
Bardziej szczegółowoStatystyczna analiza danych
Statystyczna analiza danych ukryte modele Markowa, zastosowania Anna Gambin Instytut Informatyki Uniwersytet Warszawski plan na dziś Ukryte modele Markowa w praktyce modelowania rodzin białek multiuliniowienia
Bardziej szczegółowoWykład 10 2008-04-30. Bioinformatyka. Wykład 9. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM
Bioinformatyka Wykład 9 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Konsekwencje zestawieo wielu sekwencji - rodziny białkowe, domeny, motywy i wzorce 2 Bioinformatyka,
Bardziej szczegółowoBioinformatyka Laboratorium, 30h. Michał Bereta
Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Wyszukiwanie sekwencji Jak wyszukad z baz danych bioinformatycznych sekwencje podobne do sekwencji zadanej (ang. query
Bardziej szczegółowoprof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji
Bioinformatyka wykład 5: dopasowanie sekwencji prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie podobieństwa sekwencji stanowi podstawę wielu gałęzi
Bardziej szczegółowoWstęp do Biologii Obliczeniowej
Wstęp do Biologii Obliczeniowej Zagadnienia na kolokwium Bartek Wilczyński 5. czerwca 2018 Sekwencje DNA i grafy Sekwencje w biologii, DNA, RNA, białka, alfabety, transkrypcja DNA RNA, translacja RNA białko,
Bardziej szczegółowoKonstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Konstruowanie drzew filogenetycznych Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Drzewa filogenetyczne ukorzenione i nieukorzenione binarność konstrukcji topologia (sposób rozgałęziana
Bardziej szczegółowoGenerator testów Bioinformatyka wer / 0 Strona: 1
Przedmiot: Nazwa przedmiotu Nazwa testu: Bioinformatyka wer. 1.0.6 Nr testu 0 Klasa: V zaoczne WNB UZ Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Analiza porównawcza białek zwykle zaczyna się na badaniach
Bardziej szczegółowoHomologia, podobieństwo i analogia
Porównywanie sekwencji Homologia, podobieństwo i analogia Homologi Ortologi homologiczne geny, których rozdzielenie nastąpiło na skutek specjacji, czyli rozdzielenia gatunków, lub rzadziej horyzontalnego
Bardziej szczegółowoMotywy i podobieństwo
Motywy i podobieństwo Całość funkcja Modularna budowa białek Elementy składowe czyli miejsca wiązania, domeny 1 Motywy Motyw jest opisem określonej części trójwymiarowej struktury zawierającym charakterystyczny
Bardziej szczegółowodopasowanie sekwencji Porównywanie sekwencji Etapy dopasowywania sekwencji Homologia, podobieństwo i analogia
Porównywanie sekwencji Homologia, podobieństwo i analogia dopasowanie sekwencji Dopasowanie/porównywanie Uliniowienie Alignment W bioinformatyce, dopasowanie sekwencji jest sposobem dopasowania struktur
Bardziej szczegółowoBioinformatyka. Ocena wiarygodności dopasowania sekwencji.
Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie
Bardziej szczegółowoDopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl
Dopasowanie sekwencji c.d. Sequence alignment Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl Dopasowanie sekwencji - znaczenie Podobieństwo porównywanych sekwencji (similarity) może świadczyć
Bardziej szczegółowoDopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl
Dopasowanie sekwencji c.d. Sequence alignment Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl dopasowanie - metody dopasowanie par sekwencji: Macierz punktów - dot matrix, dotplot Programowanie
Bardziej szczegółowoGenomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski
Genomika Porównawcza Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski 1 Plan prezentacji 1. Rodzaje i budowa drzew filogenetycznych 2. Metody ukorzeniania drzewa
Bardziej szczegółowoBIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański
BIOINFORMATYKA edycja 2016 / 2017 wykład 11 RNA dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Rola i rodzaje RNA 2. Oddziaływania wewnątrzcząsteczkowe i struktury
Bardziej szczegółowoBioinformatyka II Modelowanie struktury białek
Bioinformatyka II Modelowanie struktury białek 1. Który spośród wymienionych szablonów wybierzesz do modelowania? Dlaczego? Struktura krystaliczną czy NMR (to samo białko, ta sama rozdzielczość)? Strukturę
Bardziej szczegółowoZmienność ewolucyjna. Ewolucja molekularna
Zmienność ewolucyjna Ewolucja molekularna Mechanizmy ewolucji Generujące zmienność mutacje rearanżacje genomu horyzontalny transfer genów! Działające na warianty wytworzone przez zmienność dobór naturalny
Bardziej szczegółowoMechanizmy zmienności ewolucyjnej. Podstawy ewolucji molekularnej.
Mechanizmy zmienności ewolucyjnej Podstawy ewolucji molekularnej. Mechanizmy ewolucji } Generujące zmienność } mutacje } rearanżacje genomu } horyzontalny transfer genów } Działające na warianty wytworzone
Bardziej szczegółowoMultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński
MultiSETTER: web server for multiple RNA structure comparison Sandra Sobierajska Uniwersytet Jagielloński Wprowadzenie Budowa RNA: - struktura pierwszorzędowa sekwencja nukleotydów w łańcuchu: A, U, G,
Bardziej szczegółowoGenerator testów bioinformatyka wer / Strona: 1
Przedmiot: wyklad monograficzny Nazwa testu: bioinformatyka wer. 1.0.6 Nr testu 10469906 Klasa: 5 IBOS Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Aminokwas jest to związek organiczny zawierający A) grupę
Bardziej szczegółowoBioinformatyka. z sylabusu...
Bioinformatyka Wykład 1. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas z sylabusu... Wykład 1, 2008 1 Co to jest Bioinformatyka? Zastosowanie technologii informacji do
Bardziej szczegółowoPodstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek
Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Zmiany genetyczne w ewolucji } Mutacje } tworzą nowe allele genów } Inwersje } zmieniają układ genów na chromosomach } mogą uniemożliwić rekombinację
Bardziej szczegółowoAlgorytmy kombinatoryczne w bioinformatyce
lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie
Bardziej szczegółowoAnalizy filogenetyczne
BIOINFORMATYKA edycja 2016 / 2017 wykład 6 Analizy filogenetyczne dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Cele i zastosowania 2. Podstawy ewolucyjne
Bardziej szczegółowoHistoria informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją).
Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją). Czym jest życie? metabolizm + informacja (replikacja) 2 Cząsteczki organiczne mog y powstać w atmosferze pierwotnej
Bardziej szczegółowoUrszula Poziomek, doradca metodyczny w zakresie biologii Materiał dydaktyczny przygotowany na konferencję z cyklu Na miarę Nobla, 14 stycznia 2010 r.
Ćwiczenie 1 1 Wstęp Rozważając możliwe powiązania filogenetyczne gatunków, systematyka porównuje dane molekularne. Najskuteczniejszym sposobem badania i weryfikacji różnych hipotez filogenetycznych jest
Bardziej szczegółowoBioinformatyka Laboratorium, 30h. Michał Bereta
Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Filogenetyka molekularna wykorzystuje informację zawartą w sekwencjach aminokwasów lub nukleotydów do kontrukcji drzew
Bardziej szczegółowoAnalizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???
Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*
Bardziej szczegółowoAcknowledgement. Drzewa filogenetyczne
Wykład 8 Drzewa Filogenetyczne Lokalizacja genów Some figures from: Acknowledgement M. Zvelebil, J.O. Baum, Introduction to Bioinformatics, Garland Science 2008 Tradycyjne drzewa pokrewieństwa Drzewa oparte
Bardziej szczegółowoBioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d.
Bioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 11.01.11 1 Dopasowanie strukturalne (alignment) odległość: d ij = (x i -x J ) 2 + (y i -y J ) 2
Bardziej szczegółowoMSA i analizy filogenetyczne
Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański MSA i analizy filogenetyczne 1. Dopasowania wielosekwencyjne - wprowadzenie Dopasowanie wielosekwencyjne
Bardziej szczegółowoPodstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek
Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Zmiany genetyczne w ewolucji Mutacje tworzą nowe allele genów Inwersje zmieniają układ genów na chromosomach mogą uniemożliwić rekombinację
Bardziej szczegółowoBioinformatyka Laboratorium, 30h. Michał Bereta
Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecność Literatura, materiały Bioinformatyka i ewolucja
Bardziej szczegółowoPodstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek
Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Egzamin: 29.01.2018 16:00, sala 9B Pierwsza synteza Ewolucja jako zmiany częstości alleli w populacji Mutacje jako źródło nowych alleli Dobór
Bardziej szczegółowoBioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee
Bioinformatyka 2 (BT172) Wykład 5 Progresywne metody wyznaczania MSA: T-coffee Krzysztof Murzyn 14.XI.2005 PLAN WYKŁADU Ostatnio : definicje, zastosowania MSA, złożoność obliczeniowa algorytmu wyznaczania
Bardziej szczegółowoBioinformatyka: Wykład 2. Algorytm Smitha Watermana implementacja w języku Python
Bioinformatyka: Wykład 2 Algorytm Smitha Watermana implementacja w języku Python Przyrównanie sekwencji Algorytm Smitha-Watermana dla pary sekwencji P i Q o długościach odpowiednio M i N. Zbuduj macierz
Bardziej szczegółowoTeoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej
Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej Specjacja } Pojawienie się bariery reprodukcyjnej między populacjami dające początek gatunkom } Specjacja allopatryczna
Bardziej szczegółowoBioinformatyka wykład 3.I.2008
Bioinformatyka wykład 3.I.2008 Białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 2008-01-03 1 Plan wykładu analiza i porównywanie struktur białek. doświadczalne metody badania struktur
Bardziej szczegółowoBioinformatyka wykład 8, 27.XI.2012
Bioinformatyka wykład 8, 27.XI.2012 białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 2013-01-21 1 Plan wykładu regiony nieuporządkowane sposoby przedstawienia struktur białkowych powierzchnia
Bardziej szczegółowoBioinformatyka Laboratorium, 30h. Michał Bereta
Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecnośd Literatura, materiały i ewolucja molekularna
Bardziej szczegółowoĆwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.
Ćwiczenie 5/6 Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST. Prof. dr hab. Roman Zieliński 1. Informacja genetyczna u
Bardziej szczegółowoAlgorytmy kombinatoryczne w bioinformatyce
lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie
Bardziej szczegółowoEwolucja informacji genetycznej
1 Ewolucja informacji genetycznej Czym jest życie? metabolizm + informacja (replikacja) Cząsteczki organiczne mog y powstać w atmosferze pierwotnej Ziemi Oparin, Haldane Miller, 1953 Co by o najpierw?
Bardziej szczegółowoD: Dopasowanie sekwencji. Programowanie dynamiczne
D: Dopasowanie sekwencji. Programowanie dynamiczne Problem: jak porównywać sekwencje DNA? Czy te sekwencje są podobne? Jeśli są podobne, to jak mierzyć to podobieństwo? Odpowiedzi są kluczowe dla konstrukcji
Bardziej szczegółowoBadanie doboru naturalnego na poziomie molekularnym
Badanie doboru naturalnego na poziomie molekularnym Podstawy ewolucji molekulanej Jak ewoluują sekwencje Zmiany genetyczne w ewolucji Mutacje tworzą nowe allele genów Inwersje zmieniają układ genów na
Bardziej szczegółowo3 Przeszukiwanie baz danych
Spis treści 3 Przeszukiwanie baz danych 1 3.1 Heurystyczne algorytmy...................... 1 3.1.1 FASTA........................... 1 3.1.2 BLAST........................... 3 3.2 Macierze substytucyjne.......................
Bardziej szczegółowoBioinformatyka II Modelowanie struktury białek
Bioinformatyka II Modelowanie struktury białek 1. Który spośród wymienionych szablonów wybierzesz do modelowania dla każdego z podanych przypadków? Dlaczego? Struktura krystaliczną czy NMR (to samo białko,
Bardziej szczegółowoAnalizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???
Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*
Bardziej szczegółowoEwolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz
Ewolucja molekularna człowieka okiem bioinformatyka Justyna Wojtczak Jarosław Jeleniewicz Informatyka w biologii - bioinformatyka Jest to szeroka dziedzina zajmująca się tworzeniem zaawansowanych baz danych,
Bardziej szczegółowoPodstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek
Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Podręczniki Populacja Grupa krzyżujących się ze sobą osobników oraz ich potomstwo Zbiór wszystkich alleli populacji pula genowa Najprostszy
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA
PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa - przykłady 4. Etapy konstrukcji drzewa
Bardziej szczegółowopaździernika 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II
10 października 2013: Elementarz biologii molekularnej www.bioalgorithms.info Wykład nr 2 BIOINFORMATYKA rok II Komórka: strukturalna i funkcjonalne jednostka organizmu żywego Jądro komórkowe: chroniona
Bardziej szczegółowoAnalizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???
Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*
Bardziej szczegółowoALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
Bardziej szczegółowoPodstawy biologii. Informacja genetyczna. Co to jest ewolucja.
Podstawy biologii Informacja genetyczna. Co to jest ewolucja. Materiał genetyczny Materiałem genetycznym są kwasy nukleinowe Materiałem genetycznym organizmów komórkowych jest kwas deoksyrybonukleinowy
Bardziej szczegółowoNuttall przeprowadził testy precypitacyjne białek surowicy, aby wykazać związek filogenetyczny między różnymi grupami zwierząt.
1904 Nuttall przeprowadził testy precypitacyjne białek surowicy, aby wykazać związek filogenetyczny między różnymi grupami zwierząt. M. Prakash 2007.Encyclopaedia of Gene Evolution Vol. 2, Molecular Genetics,
Bardziej szczegółowoDefinicja pliku kratowego
Pliki kratowe Definicja pliku kratowego Plik kratowy (ang grid file) jest strukturą wspierająca realizację zapytań wielowymiarowych Uporządkowanie rekordów, zawierających dane wielowymiarowe w pliku kratowym,
Bardziej szczegółowoPorównywanie sekwencji białek i kwasów nukleinowych
Porównywanie sekwencji białek i kwasów nukleinowych Krzysztof Lewiński 1. Podobieństwo i jego miara Wprawdzie podobieństwo jest pojęciem często używanym w życiu codziennym ale nie oznacza to, że możemy
Bardziej szczegółowoFilogenetyka molekularna I
2 Literatura Krzysztof Spalik, Marcin Piwczyński (2009), Rekonstrukcja filogenezy i wnioskowanie filogenetyczne w badaniach ewolucyjnych, Kosmos 58(3-4): 485-498 Filogenetyka molekularna I John C. Avise
Bardziej szczegółowoFilogenetyka molekularna. Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji
Filogenetyka molekularna Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji Co to jest filogeneza? Filogeneza=drzewo filogenetyczne=drzewo rodowe=drzewo to rozgałęziający się diagram, który
Bardziej szczegółowoBudowa aminokwasów i białek
Biofizyka Ćwiczenia 1. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas Budowa aminokwasów i białek E.Banachowicz 1 Ogólna budowa aminokwasów α w neutralnym p α N 2 COO N
Bardziej szczegółowoEwolucja informacji genetycznej
1 Ewolucja informacji genetycznej Czym jest życie? metabolizm + informacja (replikacja) Cząsteczki organiczne mogły powstać w atmosferze pierwotnej Ziemi Oparin, Haldane Miller, 1953 Co było najpierw?
Bardziej szczegółowoMACIERZE MUTACYJNE W ANALIZIE GENOMÓW czy możliwa jest rekonstrukcja filogenetyczna? Aleksandra Nowicka
MAIERZE MUTAYJNE W ANALIZIE GENOMÓW czy możliwa jest rekonstrukcja filogenetyczna? Aleksandra Nowicka Zadaniem FILOGENETYKI jest : zrekonstruowanie ewolucyjnej historii wszystkich organizmów odkrycie przodka
Bardziej szczegółowoBioinformatyka wykład 9
Bioinformatyka wykład 9 14.XII.21 białkowa bioinformatyka strukturalna krzysztof_pawlowski@sggw.pl 211-1-17 1 Plan wykładu struktury białek dlaczego? struktury białek geometria i fizyka modyfikacje kowalencyjne
Bardziej szczegółowoWstęp do sieci neuronowych, wykład 11 Łańcuchy Markova
Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova M. Czoków, J. Piersa 2010-12-21 1 Definicja Własności Losowanie z rozkładu dyskretnego 2 3 Łańcuch Markova Definicja Własności Losowanie z rozkładu
Bardziej szczegółowoBUDOWA I FUNKCJA GENOMU LUDZKIEGO
BUDOWA I FUNKCJA GENOMU LUDZKIEGO Magdalena Mayer Katedra i Zakład Genetyki Medycznej UM w Poznaniu 1. Projekt poznania genomu człowieka: Cele programu: - skonstruowanie szczegółowych map fizycznych i
Bardziej szczegółowoZmienność ewolucyjna. Ewolucja molekularna
Zmienność ewolucyjna Ewolucja molekularna Mechanizmy ewolucji Generujące zmienność mutacje rearanżacje genomu horyzontalny transfer genów Działające na warianty wytworzone przez zmienność dobór naturalny
Bardziej szczegółowoZmienność ewolucyjna. Ewolucja molekularna
Zmienność ewolucyjna Ewolucja molekularna Mechanizmy ewolucji Generujące zmienność mutacje rearanżacje genomu horyzontalny transfer genów Działające na warianty wytworzone przez zmienność dobór naturalny
Bardziej szczegółowoHierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Bardziej szczegółowoWykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
Bardziej szczegółowoWstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa
Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa M. Czoków, J. Piersa 2012-01-10 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego 3 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego
Bardziej szczegółowoWSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19
WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19 Witold Dyrka 14 marca 2019 1 Wprowadzenie 1.1 Definicje bioinformatyki Według polskiej Wikipedii [1], Bioinformatyka interdyscyplinarna dziedzina
Bardziej szczegółowoPodstawy biologii. Informacja genetyczna. Co to jest ewolucja.
Podstawy biologii Informacja genetyczna. Co to jest ewolucja. Zarys biologii molekularnej genu Podstawowe procesy genetyczne Replikacja powielanie informacji Ekspresja wyrażanie (realizowanie funkcji)
Bardziej szczegółowo