Porównywanie sekwencji białkowych
|
|
- Danuta Mazur
- 7 lat temu
- Przeglądów:
Transkrypt
1 Bioinformatyka -9 Bioinformatyka Wykład 4. E. Banachowicz Zakład Biofizyki Molekularnej Porównywanie sekwencji białkowych Wykład 4,
2 Bioinformatyka -9 Porównywanie sekwencji elem porównania białek jest między innymi przypisanie informacji znanej dla jednej cząsteczki drugiej cząsteczce (genomika/proteomika porównawcza) DN RN białko sekwencja struktura funkcja Porównywanie sekwencji Pierwsze pytanie biologa molekularnego, kiedy odkryje nową sekwencję: zy w bazie sekwencji są już sekwencje podobne? Sekwencje są identyczne nic nowego. Sekwencja jest podobna (ma krewnych ) nowy członek znanej rodziny Sekwencja ma kilka podobnych regionów, motywów lub domen można zaproponować funkcję Nie ma znaczącego podobieństwa dużo pracy.. Wykład 4,
3 Bioinformatyka -9 Identyfikacja sekwencji w BD Identyfikacja przez porównanie z innymi sekwencjami Zestawienia sekwencji = uliniowienie = =porównanie = alignment Identyfikacja sekwencji i jej funkcji Białka spokrewnione ze sobą (posiadające wspólnego przodka) mają podobne sekwencje, strukturę i funkcję Pewne istotne fragmenty (motywy) są konserwatywne i charakteryzują rodzinę białek (Bazy rodzin białkowych: PROSIE, PRINS, InterPro) Wykład 4,
4 Bioinformatyka -9 Identyfikacja sekwencji i jej funkcji? czy wszystkie białka spokrewnione mają tę samą funkcję?? czy podobieństwo krótkich fragmentów może być przypadkowe?? czy wszystkie białka pełniące tę samą funkcje muszą być spokrewnione? Ewolucyjne podstawy porównywania sekwencji Nic w Biologii (Bioinformatyce) nie ma sensu jeśli rozpatruje się to w oderwaniu od ewolucji. heodosis Dobzhansky (9975) Wykład 4, 4
5 Bioinformatyka -9 homologia/homoplazja homologia -podobieństwo ze względu na wspólnego przodka (dywergencja) homoplazja podobieństwo ze względu na konwergencję Homologia Podobieństwo Sekwencje homologiczne są podobne Sekwencje podobne nie muszą być homologiczne! Homologia = wspólny przodek Wykład 4, 5
6 Bioinformatyka -9 Homologi Hemoglobina (łańcuch α) Mioglobina Leghemoglobina hemoglobina, mioglobina i leghemoglobina Zachowawczość struktury przestrzennej Wykład 4, 6
7 Bioinformatyka -9 czas Rodziny Homologi Drzewo ewolucyjne globin. homologi: ortologi -różne gatunki, taka sama funkcja (specjacja) paralogi-podobna funkcja, ale ewoluowały niezależnie (duplikacja,ten sam organizm) analogi: różne sekwencje, różne motywy, ale identyczna orientacja ważnych aminokwasów prymitywna, pierwotna globina wiążąca tlen Molecular ell Biology,4ed. Lodish, Berk, Matsudaira, Kaiser, Krieger, Scott, Zipursky, and Darnell Wykład 4, 7
8 Bioinformatyka -9 Ortologi duplikacja oryginalny gen duplikacja specjacja b gatunek b,c,a c gen b b b gen a a a t t t gatunek b,a Homologi: paralogi (wspólny przodek w czasie duplikacji) ortologi (wspólny przodek w czasie specjacji: a-a) krowa Rodzina - homologi Rybonukleaza wołowa (enzym trawienny) człowiek Paralogi Rybonukleaza ludzka (enzym trawienny) angiogenina ludzka (stymuluje wzrost naczyń krwionośnych) (Biochemistry, J.Berg, J.ymoczko, L.Stryer.,PWN 5). Wykład 4, 8
9 Bioinformatyka -9 Dlaczego homologia jest ważna? homologia sugeruje wspólną strukturę i funkcję Homologia podobne funkcje, konserwatywność fragmentów rypsyna (myszy) P746 i trypsyna (langusty) P765 Wykład 4, 9
10 Bioinformatyka -9 S-S S-S S-S Składowa centrum aktywnego, odpowiedzialna za specyficzność substratową Układ przeniesienia ładunku Porównaj z: ezx.pdb, M9U P765 P746 Wykład 4,
11 Bioinformatyka -9 Homologia podobne funkcje a4v.pdb 5lyz.pdb nalogi Izomeraza triozofosforanowa (E 5...),4 - beta Ksylanaza Wykład 4,
12 Bioinformatyka -9 nalogi His57, sp, Ser95 His64, sp, Ser proteazy serynowe hydrolizujące wiązanie peptydowe Modele ewolucji Wykład 4,
13 Bioinformatyka -9 Modele ewolucji zy gen człowieka jest bardziej podobny do genu szympansa czy goryla? Potrzebny jest ilościowy model ewolucji. Np. wyznaczenie dopasowania sekwencji i obliczenie odsetka pozycji, na których wystąpiły różnice. Punktacja obszar dopasowania MGQKLMRVRVEGGPEVLKLRSDIVPIPKDHQVLI VRVEGPEVLRISDIVPIPKDHQVLIEIRSGS dopasowanie przerwa niedopasowanie S punktacja za dopasowanie Score = Max(S) S = (dopasowania) - (niedopasowania) - (przerwy) Wykład 4,
14 Bioinformatyka -9 liczba identycznych aminokwasów Jakość dopasowania globalnego Dla dopasowań globalnych: porównanie obliczonej wartości dla danego dopasowania z wartościami obliczonymi dla wielu dopasowań przypadkowych sekwencji o podobnym składzie i długości przykład: dopasowanie sekwencji α hemoglobiny ludzkiej i mioglobiny ludzkiej identyczne aminokwasy identyczne aminokwasy wszystkie możliwe zestawienia sekwencji, zliczanie identycznych dopasowanie Wykład 4, 4
15 Bioinformatyka -9 Jakość dopasowań zestawienia sekwencji z przerwami, zliczanie identycznych 8 identyczne aminokwasy we fragmencie o długości % identycznych aminokwasów. zy jest to znaczące podobieństwo? S = (dopasowania) - (niedopasowania) - (przerwy) Jakość dopasowań Dla dopasowań globalnych: - porównanie obliczonej wartości dla danego dopasowania z wartościami obliczonymi dla wielu dopasowań przypadkowych sekwencji o podobnym składzie i długości przypadkowe sekwencje o podobnym składzie: sekwencja jednego z białek zostaje wielokrotnie potasowna Wykład 4, 5
16 Bioinformatyka -9 liczba przyrównań Jakość dopasowań punktacja: tożsamość: + przerwa: 5 S = (dopasowania) - (przerwy) szansa uzyskania takiego odchylenia w przypadkowej punktacja sekwencji przyrównania wynosi : hemoglobina α i mioglobiny punktacja przyrównania Modele ewolucji sekwencji białkowej PM (point accepted mutations = punktowe mutacje utrwalone) macierz uwzględniająca tempo i typ możliwych podstawień aminokwasowych. Wykład 4, 6
17 Bioinformatyka -9 Wykład 4, 7 Macierz PM5 wartości w macierzy są proporcjonalne do logarytmu z (cz. docelowej/cz.tła) zbudowana na podstawie analizy par blisko spokrewnionych (PM) i ekstrapolowana do 5PM ekstrapolacje można przeprowadzić dla różnych odległości ewolucyjnych PM duże PM stosuje się do porównywania sekwencji o dużym stopniu dywergencji ewolucyjnej małe PM do badania sekwencji podobnych P 6 S W V 4 4 B Z X R N D Q E G H I L K M P S W V B Z X N D Q 4 E 4-7 G 5-7 H 6 I 5 4 L 6 4 K 5 M Dayhoff PM 5 Matrix R 6
18 Bioinformatyka -9 Wykład 4, 8 zestawienie białek wysoka punktacja oznacza: -> podstawienia są częste + -> podstawienia są częste tam gdzie jest utrwalone tam gdzie jest utrwalone P 6 S W V 4 4 B Z X R N D Q E G H I L K M P S W V B Z X N D Q 4 E 4-7 G 5-7 H 6 I 5 4 L 6 4 K 5 M R 6 Dayhoff PM 5 Matrix
19 Bioinformatyka -9 Wykład 4, 9 Pierwotne białko zestawieni sekwencji wysoka punktacja W W oznacza : inne podstawienia nie są możliwe tam gdzie W jest utrwalone W W W W W W W W W W W W W W W W W W W P 6 S W V 4 4 B Z X R N D Q E G H I L K M P S W V B Z X N D Q 4 E 4-7 G 5-7 H 6 I 5 4 L 6 4 K 5 M R 6 Dayhoff PM 5 Matrix
20 Bioinformatyka -9 skład aminokwasowy białek {rgos and Mcaldon} lanina jest bardzo pospolita minokwasy % 8..7 D 5. E 6..9 G 7. H. I 5. K 5.7 L 9. M.4 N 4.4 P 5. Q 4. R 5.7 S V 6.6 W.. ryptofan jest bardzo rzadki Małe, polarne Macierz PM5 S, Ser, hr Małe, hydrofobowe V,Val I,Ile Duże, naładowane R, rg K, Lys Wykład 4,
21 Bioinformatyka -9 Macierze BLOSUM Powstały w oparciu o bazę BLOKS dopasowanie sekwencji daleko spokrewnionych (oszacowanie częstotliwości docelowych, bez modelu ewolucyjnego) Rodzina macierzy: różnice (indeksu) związane są z maksymalnym stopniem identyczności sekwencji wziętych do obliczeń BLOSUM6 BLOSUM9 do analizy sekwencji blisko spokrewnionych BOLSUM do analizy odległych ewolucyjnie sekwencji Wykład 4,
22 Bioinformatyka -9 Reprezentacja macierzy BLOSUM 6 DEHKR naładowane NQS polarne GP hydrofobowe ILMVW duże i hydrofobowe Biochemistry, Berg, Jeremy M.; ymoczko, John L.; and Stryer, Lubert. New ork: W. H. reeman and o.; (), Rys.7.9 Statystyczne znaczenie dopasowań jaka jest wartość/ istotność dopasowania? Jaka jest wartość świadczy o homologii, a jaka o przypadkowym podobieństwie? Wykład 4,
23 Bioinformatyka -9 z macierzami substytucji Jakość dopasowań punktacja: BLOSUM6 otwarcie przerwy: wydłużenie przerwy: identyczne podobne = substytucje konserwatywne S = (dopasowania) - (niedopasowania) - (przerwy) z macierzami substytucji pozwala wykryć homologię białek pokrewnych w mniejszym stopniu Jakość dopasowań punktacja: BLOSUM6 otwarcie przerwy: wydłużenie przerwy: Mioglobina ludzka Leghemoglobina z łubinu identyczność: % S = (dopasowania) - (niedopasowania) - (przerwy) Wykład 4,
24 Bioinformatyka -9 liczba przyrównań liczba przyrównań Jakość dopasowań Mioglobina ludzka Leghemoglobina z łubinu punktacja przyrównania (tylko identyczne) punktacja przyrównania (BLOSUM6) () punktacja oparta o identyczność -szansa dopasowanie tylko na zasadzie przypadku : (B) punktacja oparta o konserwatywne substytucje - szansa dopasowanie tylko na zasadzie przypadku : Jakość dopasowania Dla sekwencji dłuższych niż aminokwasów identyczność wyższa niż 5% prawie na pewno nie jest przypadkowa prawdopodobieństwo homologii identyczność niższa niż 5% mało prawdopodobne, żeby podobieństwo było statystycznie istotne Brak statystycznej istotności nie wyklucza homologii Wykład 4, 4
25 Bioinformatyka -9 hemoglobina, mioglobina i leghemoglobina Zachowawczość struktury przestrzennej α hemoglobina (homo sapiens) P6995 (Expasy) mioglobina (homo sapiens) P44 (Expasy) leghemoglobina (łubin) P9 (Expasy) EMBOSS Pairwise lignment lgorithms Wykład 4, 5
26 Bioinformatyka -9 Global alignment SIM P44, P6995 Wykład 4, 6
27 Bioinformatyka -9 Jakość dopasowania lokalnego () unkcja gęstości prawdopodobieństwa = rozkład wartości granicznej E(S) rozkład spodziewanych dopasowań, które mają wartość przynajmniej równą S E (S) = K m n exp(-λs) Statystyczne znaczenie dopasowań jaka jest wartość/ istotność dopasowania? Dla dopasowań globalnych: porównanie obliczonej wartości dla danego dopasowania z wartościami obliczonymi dla wielu dopasowań przypadkowych sekwencji o podobnym składzie i długości Wykład 4, 7
28 Bioinformatyka -9 E (S) = K m n exp -λs Expected value, wartość oczekiwana sekwencji mających wartość co najmniej S S bit score, punktacja podobieństwa m range of alignment, długość porównywanego segmentu n wielkość bazy λ - określa wpływ systemu punktowania K liczba powtarzających się segmentów w przeszukiwanej sekwencji Bit Score unormowany score, wartość uniezależniona od długości sekwencji Dopasowanie sekwencji Wykład 4, 8
29 Bioinformatyka -9 lgorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne (BLS, S) metody statystyczne (modele Markova, statystyka Bayesa) Rodzaje dopasowań pokrycie sekwencji globalne, lokalne liczba sekwencji porównywanych para (pairwise sequence alignment) więcej niż dwie (multiple sequences alignment) Pokrycie sekwencji dopasowanie globalne dopasowanie wzdłuż całej sekwencji (zastosowanie: do białek składających się z pojedynczej domeny lub homologicznych słabo zróżnicowanych) dopasowanie lokalne uwzględnia domenową naturę białek, szuka subsekwencji (zastosowanie: do białek wielodomenowych, mrn z sekwencją genomową) 59 Wykład 4, 9
30 Bioinformatyka -9 Liniowe zestawienie dwóch sekwencji Pairwise Sequence lignment sekwencja BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER sekwencja Ogólne spojrzenie na problem laresansom BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER Wykład 4,
31 Bioinformatyka -9 BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER Wykład 4,
32 Bioinformatyka -9 BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER Wykład 4,
33 Bioinformatyka -9 Insercja/Delecja => GPS zestawienie jeden-do-jeden przerwy odzwierciedlają wydarzenia ewolucyjne (wyzwanie dla programistów) BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS BEERGLEDILGERGSOUWERM BEERNLEDLGERDWGLSOUWRRWER laresansom Wykład 4,
34 Bioinformatyka -9 Insercja/Delecja => GPS BEERGLEDILGERGSOUWERM BEERN-LEDLGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS BEERGLEDILGERGSOUWERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Wykład 4, 4
35 Bioinformatyka -9 Insercja/Delecja => GPS BEERGLEDILGERG-SOUWERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS BEERGLEDILGERG--SOUWERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Wykład 4, 5
36 Bioinformatyka -9 Insercja/Delecja => GPS BEERGLEDILGERG---SOUWERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS BEERGLEDILGERG---SOU-WERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Wykład 4, 6
37 Bioinformatyka -9 Insercja/Delecja => GPS BEERGLEDILGERG---SOU--WERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Insercja/Delecja => GPS G<->W = -7 G<->G = +5 BEERGLEDILGER-G--SOU--WERM BEERN-LED-LGERDWGLSOUWRRWER laresansom Wykład 4, 7
38 Bioinformatyka -9 Insercja/Delecja => GPS G<->W = -7 G<->G = +5 BEERGLEDILGER-G--SOU--WERM -BEERN-LED-LGERDWGLSOUWRRWER <-> = <-> = + laresansom Macierze punktowe (DotPlot) Macierze DotPlot opierają się na ocenie wizualnej i czasami skuteczniejsze niż alignment wykrywają fragmenty powtarzające się, rearanżacje i podobieństawa lokalne Dotter: Wykład 4, 8
39 Bioinformatyka -9 H I S S E Q E N E H I S S E Q E N E Dotter niektóre układy punktów tworzą ścieżkę każda ścieżka odpowiada jednemu dopasowaniu M S E Q U E N E H I S S E Q E N E M S E Q U E N E H I S S E Q E N E znaleźć najlepszą ścieżkę! M S E Q U E N E Dotter kropka w miejscu dopasowania układ kropek tworzy ścieżkę M S E Q U E N E H I S S E Q E N E M S E Q U E N E H I S S E Q E N E zy wprowadzenie przerwy da lepsze dopasowanie? M S E Q U E N E Wykład 4, 9
40 Bioinformatyka -9 H I S S E Q E N E Dotter wprowadzenie przerwy wydłużenie ścieżki M S E Q U E N E H I S S E Q E N E M S E Q U E N E H I S S E Q E N E M S E Q U E N E M S E Q U E N E H I S S E Q - E N E Najlepsza ścieżka? G G Wykład 4, 4
41 Bioinformatyka -9 Najlepsza ścieżka? G G każda ścieżka odpowiada jakiemuś dopasowaniu która z nich jest optymalna? Najlepsza ścieżka Madryt Poznań optymalna? najszybsza? najkrótsza? Wykład 4, 4
42 Bioinformatyka -9 Najlepsza ścieżka najlepsza ścieżka = Zestawienia sekwencji zależy od sposobu punktowania. tożsamości, podobieństwa, przerwy Wartości substytucji i kary za przerwy schemat wartościowania I: (match) dopasowany: + (mismatch) niedopasowany: (gap) przerwa: (nie-afiniczne kary za przerwy każda przerwa traktowana jest tak samo) schemat wartościowania II: dopasowany: + niedopasowany: otwarcie przerwy: G przedłużenie przerwy: L (afiniczne kary za przerwy kara za otwarcie, kary za przedłużenie ) Wykład 4, 4
43 Bioinformatyka -9 Punktacja obszar dopasowania GGGGGGG GGGG-GGGGG dopasowanie przerwa niedopasowanie S punktacja za dopasowanie Score = Max(S) S = (dopasowania) - (niedopasowania) - (przerwy) Punktowanie przerw non-affine model (nieafinicznie): równo (match:4, mismatch:, gap:) affine model (afinicznie): G + L n (match:4, mismatch:, gap creation:-8, gap:) GGG------G GGGGG : :7 GGG------G GGGGG : : G 4 4 G Wykład 4, 4
44 Bioinformatyka -9 DotPlot -metody najprościej: kropka w miejscu identycznych znaków w sekwencjach lepiej: zastosowanie tablicy podobieństw (macierzy substytucji) kropka w miejscu, gdzie wartość podobieństwa przekracza określoną wartość lepiej: porównywanie okienek wstawianie kropek tam, gdzie ciąg n-liter ma punktację większą niż pewna wartość, albo jest określona liczba identycznych liter jeszcze lepiej: odfiltrowanie mniej istotnych kropek DotPlot najprostsza metoda W. Makałowski, 5 Wykład 4, 44
45 Bioinformatyka -9 DotPlot najprostsza metoda DotPlot metoda okienkowa obliczyć punktację w okienku o zadanym rozmiarze (window size) ocenić czy punktacja spełnia określone warunki (threshold) przesunąć okienko o zadany krok (step) Wykład 4, 45
46 Bioinformatyka -9 DotPlot metoda okienkowa kropka= x brak kropki= o window size: 9 threshold: 6 step: DotPlot metoda okienkowa window size: 9 threshold: step: 6 Wykład 4, 46
47 Bioinformatyka -9 DotPlot metoda okienkowa window size: 9 threshold: step: 6 DotPlot metoda okienkowa window size: 9 threshold: step: 6 Wykład 4, 47
48 Bioinformatyka -9 DotPlot metoda okienkowa window size: 9 threshold: step: 6 Programowanie dynamiczne najlepsza ścieżka schemat wartościowania I: (match) dopasowany: + (mismatch) niedopasowany: (gap) przerwa: (nie-afiniczne kary za przerwy każda przerwa traktowana jest tak samo) G G Wykład 4, 48
49 Bioinformatyka -9 Programowanie dynamiczne zasady: G G dopasowane z = dopasowane z = + NULL dopasowane z = dopasowane z NULL = Programowanie dynamiczne G G + Wykład 4, 49
50 Bioinformatyka -9 Programowanie dynamiczne G G + stopniowe poszerzanie ścieżek Programowanie dynamiczne G G + + stopniowe poszerzanie ścieżek Wykład 4, 5
51 Bioinformatyka -9 Programowanie dynamiczne G G + + stopniowe poszerzanie ścieżek Programowanie dynamiczne G G stopniowe poszerzanie ścieżek Wykład 4, 5
52 Bioinformatyka -9 Programowanie dynamiczne G G stopniowe poszerzanie ścieżek wszystkie punkty musza zostać zbadane Programowanie dynamiczne G G stopniowe poszerzanie ścieżek Wykład 4, 5
53 Bioinformatyka -9 Programowanie dynamiczne G G stopniowe poszerzanie ścieżek G- G Programowanie dynamiczne G G stopniowe poszerzanie ścieżek G- G Wykład 4, 5
54 Bioinformatyka -9 G G G lgorytm Needleman -Wunsh a znaleźć zestawienie z max score! G G macierz elementy ij powtarzaj ij = max( i,j + S( i,b j ), i,j + d, i,j + d) sekwencja B sekwencja = j = i = lgorytm Needleman -Wunsh a pseudo-code (tworzenie macierzy ): for i= to lengh() (i,) <- for j= to lengh(b) (,j) <- for i= to lengh() for j= to lengh(b) { choice <- (i,j + S((i),B(j)) choice <- (i,j) + d choice <- (i,j) + d (i,j) <- max(choice,choice,choice) } i = j = Wykład 4, 54
55 Bioinformatyka -9 lgorytm Needleman -Wunsh a ten element macierzy ma zawsze, dla każdego zestawienia najwyższą wartość Odtworzenie zestawienia sekwencji, dającego najwyższą punktację, polega na sprawdzaniu źródeł ( możliwości), z których można dotrzeć do danego punktu i,j: jeśli choice to zestawienie (i) z B(j) jeśli choice to zestawinie (i) z przerwą jeśli choise to zestawienia B(j) z przerwą lgorytm Needleman -Wunsh a pseudo-code (budowania zestawienia): lignment <- lignmentb <- i <- length() j <- length(b) while (i> ND j>) { Score <- (i,j) ScoreDiag <- (i,j) ScoreUp <- (i, j) ScoreLeft <- (i,j) if (Score S((i),B(j))==ScoreDiag { lignment <- (i)+ lignment lignmentb <- B(j)+ lignmentb i <- i j <- j } Wykład 4, 55
56 Bioinformatyka -9 lgorytm Needleman -Wunsh a Score <- (i,j) ScoreDiag <- (i,j) ScoreUp <- (i, j) ScoreLeft <- (i,j) if (Score S((i),B(j))==ScoreDiag { lignment <- (i)+ lignment lignmentb <- B(j)+ lignmentb i <- i j <- j } else if (Score == ScoreLeft d) { lignment <- (i)+ lignment lignmentb <- - + lignmentb i <- i } } while (i>=) {. lgorytm Needleman -Wunsh a else if (Score == ScoreLeft d) { lignment <- (i)+ lignment lignmentb <- - + lignmentb i <- i } otherwise (Score == ScoreUp d) { lignment <- - + lignment lignmentb <- B(j)+ lignmentb j <- j } Wykład 4, 56
57 Bioinformatyka -9 lgorytm Needleman -Wunsh a while (i>=) { lignment <- (i) + ligment lignmentb <- - + ligmentb i <- i } while (j>=) { lignment <- - + ligment lignmentb <- B(j) + ligmentb j <- j } } Podsumowanie lgorytmy porównywania sekwencji oparte na programowaniu dynamicznym gwarantują znalezienie optymalnego (najlepszego) zestawienia dwóch sekwencji wymagają dużych rezerw pamięci i czasu Wykład 4, 57
58 Bioinformatyka -9 Programowanie dynamiczne Metody dynamiczne dobre są do zestawienia (porównania) dwóch sekwencji Jeśli celem jest znalezienie sekwencji homologicznych przeszukać trzeba bazę sekwencji. Przeszukać = porównać każdą sekwencję w bazie z zadaną sekwencją (query) to może być trudne.. Metody dynamiczne są raczej powolne i wymagają pamięci (na np. zapamiętanie macierzy (nm) = O(nm)) Programowanie dynamiczne Rozmiar baz danych (rośnie ekspotencjalnie) białkowa: ok. reszt aminokwasowych nukleotydowa: nukleotydów zas pracy komputera z mocą obliczeniową 7 komórek macierzy/sekundę (pełne zestawienie metodami dynamicznymi) białko aminokwasów: 5 godzin dla bazy białkowej DN nukleotydów: 5555 godzin ( dni) w GenBanku (wg. W. Makałowskiego) Wykład 4, 58
59 Bioinformatyka -9 Koniec Wykład 4, 59
Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM
Bioinformatyka (wykład monograficzny) wykład 5. E. Banachowicz Zakład Biofizyki Molekularnej IF UM http://www.amu.edu.pl/~ewas lgorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne
Bioinformatyka. Porównywanie sekwencji
Bioinformatyka Wykład 5 E. Banachowicz Zakład Biofizyki Molekularnej IF UM 1 http://www.amu.edu.pl/~ewas Porównywanie sekwencji Pierwsze pytanie biologa molekularnego, kiedy odkryje nową sekwencję: zy
PRZYRÓWNANIE SEKWENCJI
http://theta.edu.pl/ Podstawy Bioinformatyki III PRZYRÓWNANIE SEKWENCJI 1 Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych), które posiadają
Dopasowanie sekwencji (sequence alignment)
Co to jest alignment? Dopasowanie sekwencji (sequence alignment) Alignment jest sposobem dopasowania struktur pierwszorzędowych DNA, RNA lub białek do zidentyfikowanych regionów w celu określenia podobieństwa;
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów
Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Przyrównanie sekwencji Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych),
Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010)
Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów
Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012)
Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie
Dopasowania par sekwencji DNA
Dopasowania par sekwencji DNA Tworzenie uliniowień (dopasowań, tzw. alignmentów ) par sekwencji PSA Pairwise Sequence Alignment Dopasowania globalne i lokalne ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA
Bioinformatyka Laboratorium, 30h. Michał Bereta
Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Często dopasować chcemy nie dwie sekwencje ale kilkanaście lub więcej 2 Istnieją dokładne algorytmy, lecz są one niewydajne
Porównywanie i dopasowywanie sekwencji
Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek narodziła się nowa dyscyplina nauki ewolucja molekularna Ewolucja molekularna
Porównywanie i dopasowywanie sekwencji
Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek pojawiła się nowa możliwość śledzenia ewolucji na poziomie molekularnym Ewolucja
Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment
Dopasowywanie sekwencji Sequence alignment Drzewo filogenetyczne Kserokopiarka zadanie: skopiować 300 stron. Co może pójść źle? 2x ta sama strona Opuszczona strona Nadmiarowa pusta strona Strona do góry
Przyrównywanie sekwencji
Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański Przyrównywanie sekwencji 1. Porównywanie sekwencji wprowadzenie Sekwencje porównujemy po to, aby
Spis treści 8 Ewolucja molekularna... 87. 9 Ewolucyjne podstawy porównywania sekwencji... 87. 9.1 Identyfikacja sekwencji i jej funkcji...
Spis treści 8 Ewolucja molekularna... 87 9 Ewolucyjne podstawy porównywania sekwencji... 87 9.1 Identyfikacja sekwencji i jej funkcji... 87 9.2 Homologia... 88 9.3 Modele ewolucji sekwencji białkowej...
Wykład 5 Dopasowywanie lokalne
Wykład 5 Dopasowywanie lokalne Dopasowanie par (sekwencji) Dopasowanie globalne C A T W A L K C A T W A L K C O W A R D C X X O X W X A X R X D X Globalne dopasowanie Schemat punktowania (uproszczony)
Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych...
Przedmowa... XI Część pierwsza Wprowadzenie i biologiczne bazy danych 1 Wprowadzenie... 3 Czym jest bioinformatyka?... 5 Cele... 5 Zakres zainteresowań... 6 Zastosowania... 7 Ograniczenia... 8 Przyszłe
Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania
Wprowadzenie do Informatyki Biomedycznej Wykład 2: Metody dopasowywania sekwencji Wydział Informatyki PB Dopasowywanie sekwencji (ang. sequence alignment) Dopasowywanie (przyrównywanie) sekwencji polega
Dopasowanie par sekwencji
BIOINFORMTYK edycja 2016 / 2017 wykład 3 Dopasowanie par sekwencji dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Idea i cele dopasowania sekwencji 2. Definicje
PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW
PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW DOPASOWYWANIE SEKWENCJI 1. Miary podobieństwa sekwencji aminokwasów 2. Zastosowanie programów: CLUSTAL OMEGA BLAST Copyright 2013, Joanna Szyda
PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA
PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa 4. Etapy konstrukcji drzewa filogenetycznego
Bioinformatyka. Podsumowanie algorytmów dynamicznych
Bioinformatyka Wykład 5 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas Podsumowanie algorytmów dynamicznych Algorytmy porównywania sekwencji oparte na programowaniu dynamicznym
Bioinformatyka. z sylabusu... (wykład monograficzny) wykład 1. E. Banachowicz. Wykład monograficzny Bioinformatyka.
Bioinformatyka (wykład monograficzny) wykład 1. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas z sylabusu... Wykład 1, 2006 1 Co to jest Bioinformatyka? Zastosowanie technologii
plezjomorfie: podobieństwa dziedziczone po dalszych przodkach (c. atawistyczna)
Podobieństwa pomiędzy organizmami - cechy homologiczne: podobieństwa wynikające z dziedziczenia - apomorfie: podobieństwa dziedziczone po najbliższym przodku lub pojawiająca się de novo (c. ewolucyjnie
Generator testów 1.3.1 Bioinformatyka_zdalne wer. 1.0.13 / 0 Strona: 1
Przedmiot: Bioinformatyka Nazwa testu: Bioinformatyka_zdalne wer. 1.0.13 Nr testu 0 Klasa: WNB UZ Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Model Markowa substytucji aminokwasów w mutagenezie białek zakłada...
Wykład Bioinformatyka 2012-09-24. Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki
Bioinformatyka Wykład 7 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Plan Bioinformatyka Ewolucyjne podstawy Bioinformatyki Filogenetyka Bioinformatyczne narzędzia
Statystyczna analiza danych
Statystyczna analiza danych ukryte modele Markowa, zastosowania Anna Gambin Instytut Informatyki Uniwersytet Warszawski plan na dziś Ukryte modele Markowa w praktyce modelowania rodzin białek multiuliniowienia
Wykład 10 2008-04-30. Bioinformatyka. Wykład 9. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM
Bioinformatyka Wykład 9 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Konsekwencje zestawieo wielu sekwencji - rodziny białkowe, domeny, motywy i wzorce 2 Bioinformatyka,
Bioinformatyka Laboratorium, 30h. Michał Bereta
Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Wyszukiwanie sekwencji Jak wyszukad z baz danych bioinformatycznych sekwencje podobne do sekwencji zadanej (ang. query
prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji
Bioinformatyka wykład 5: dopasowanie sekwencji prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie podobieństwa sekwencji stanowi podstawę wielu gałęzi
Wstęp do Biologii Obliczeniowej
Wstęp do Biologii Obliczeniowej Zagadnienia na kolokwium Bartek Wilczyński 5. czerwca 2018 Sekwencje DNA i grafy Sekwencje w biologii, DNA, RNA, białka, alfabety, transkrypcja DNA RNA, translacja RNA białko,
Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Konstruowanie drzew filogenetycznych Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Drzewa filogenetyczne ukorzenione i nieukorzenione binarność konstrukcji topologia (sposób rozgałęziana
Generator testów Bioinformatyka wer / 0 Strona: 1
Przedmiot: Nazwa przedmiotu Nazwa testu: Bioinformatyka wer. 1.0.6 Nr testu 0 Klasa: V zaoczne WNB UZ Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Analiza porównawcza białek zwykle zaczyna się na badaniach
Homologia, podobieństwo i analogia
Porównywanie sekwencji Homologia, podobieństwo i analogia Homologi Ortologi homologiczne geny, których rozdzielenie nastąpiło na skutek specjacji, czyli rozdzielenia gatunków, lub rzadziej horyzontalnego
Motywy i podobieństwo
Motywy i podobieństwo Całość funkcja Modularna budowa białek Elementy składowe czyli miejsca wiązania, domeny 1 Motywy Motyw jest opisem określonej części trójwymiarowej struktury zawierającym charakterystyczny
dopasowanie sekwencji Porównywanie sekwencji Etapy dopasowywania sekwencji Homologia, podobieństwo i analogia
Porównywanie sekwencji Homologia, podobieństwo i analogia dopasowanie sekwencji Dopasowanie/porównywanie Uliniowienie Alignment W bioinformatyce, dopasowanie sekwencji jest sposobem dopasowania struktur
Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.
Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie
Dopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl
Dopasowanie sekwencji c.d. Sequence alignment Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl Dopasowanie sekwencji - znaczenie Podobieństwo porównywanych sekwencji (similarity) może świadczyć
Dopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl
Dopasowanie sekwencji c.d. Sequence alignment Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl dopasowanie - metody dopasowanie par sekwencji: Macierz punktów - dot matrix, dotplot Programowanie
Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski
Genomika Porównawcza Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski 1 Plan prezentacji 1. Rodzaje i budowa drzew filogenetycznych 2. Metody ukorzeniania drzewa
BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański
BIOINFORMATYKA edycja 2016 / 2017 wykład 11 RNA dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Rola i rodzaje RNA 2. Oddziaływania wewnątrzcząsteczkowe i struktury
Bioinformatyka II Modelowanie struktury białek
Bioinformatyka II Modelowanie struktury białek 1. Który spośród wymienionych szablonów wybierzesz do modelowania? Dlaczego? Struktura krystaliczną czy NMR (to samo białko, ta sama rozdzielczość)? Strukturę
Zmienność ewolucyjna. Ewolucja molekularna
Zmienność ewolucyjna Ewolucja molekularna Mechanizmy ewolucji Generujące zmienność mutacje rearanżacje genomu horyzontalny transfer genów! Działające na warianty wytworzone przez zmienność dobór naturalny
Mechanizmy zmienności ewolucyjnej. Podstawy ewolucji molekularnej.
Mechanizmy zmienności ewolucyjnej Podstawy ewolucji molekularnej. Mechanizmy ewolucji } Generujące zmienność } mutacje } rearanżacje genomu } horyzontalny transfer genów } Działające na warianty wytworzone
MultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński
MultiSETTER: web server for multiple RNA structure comparison Sandra Sobierajska Uniwersytet Jagielloński Wprowadzenie Budowa RNA: - struktura pierwszorzędowa sekwencja nukleotydów w łańcuchu: A, U, G,
Generator testów bioinformatyka wer / Strona: 1
Przedmiot: wyklad monograficzny Nazwa testu: bioinformatyka wer. 1.0.6 Nr testu 10469906 Klasa: 5 IBOS Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Aminokwas jest to związek organiczny zawierający A) grupę
Bioinformatyka. z sylabusu...
Bioinformatyka Wykład 1. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas z sylabusu... Wykład 1, 2008 1 Co to jest Bioinformatyka? Zastosowanie technologii informacji do
Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek
Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Zmiany genetyczne w ewolucji } Mutacje } tworzą nowe allele genów } Inwersje } zmieniają układ genów na chromosomach } mogą uniemożliwić rekombinację
Algorytmy kombinatoryczne w bioinformatyce
lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie
Analizy filogenetyczne
BIOINFORMATYKA edycja 2016 / 2017 wykład 6 Analizy filogenetyczne dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Cele i zastosowania 2. Podstawy ewolucyjne
Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją).
Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją). Czym jest życie? metabolizm + informacja (replikacja) 2 Cząsteczki organiczne mog y powstać w atmosferze pierwotnej
Urszula Poziomek, doradca metodyczny w zakresie biologii Materiał dydaktyczny przygotowany na konferencję z cyklu Na miarę Nobla, 14 stycznia 2010 r.
Ćwiczenie 1 1 Wstęp Rozważając możliwe powiązania filogenetyczne gatunków, systematyka porównuje dane molekularne. Najskuteczniejszym sposobem badania i weryfikacji różnych hipotez filogenetycznych jest
Bioinformatyka Laboratorium, 30h. Michał Bereta
Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Filogenetyka molekularna wykorzystuje informację zawartą w sekwencjach aminokwasów lub nukleotydów do kontrukcji drzew
Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???
Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*
Acknowledgement. Drzewa filogenetyczne
Wykład 8 Drzewa Filogenetyczne Lokalizacja genów Some figures from: Acknowledgement M. Zvelebil, J.O. Baum, Introduction to Bioinformatics, Garland Science 2008 Tradycyjne drzewa pokrewieństwa Drzewa oparte
Bioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d.
Bioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 11.01.11 1 Dopasowanie strukturalne (alignment) odległość: d ij = (x i -x J ) 2 + (y i -y J ) 2
MSA i analizy filogenetyczne
Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański MSA i analizy filogenetyczne 1. Dopasowania wielosekwencyjne - wprowadzenie Dopasowanie wielosekwencyjne
Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek
Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Zmiany genetyczne w ewolucji Mutacje tworzą nowe allele genów Inwersje zmieniają układ genów na chromosomach mogą uniemożliwić rekombinację
Bioinformatyka Laboratorium, 30h. Michał Bereta
Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecność Literatura, materiały Bioinformatyka i ewolucja
Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek
Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Egzamin: 29.01.2018 16:00, sala 9B Pierwsza synteza Ewolucja jako zmiany częstości alleli w populacji Mutacje jako źródło nowych alleli Dobór
Bioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee
Bioinformatyka 2 (BT172) Wykład 5 Progresywne metody wyznaczania MSA: T-coffee Krzysztof Murzyn 14.XI.2005 PLAN WYKŁADU Ostatnio : definicje, zastosowania MSA, złożoność obliczeniowa algorytmu wyznaczania
Bioinformatyka: Wykład 2. Algorytm Smitha Watermana implementacja w języku Python
Bioinformatyka: Wykład 2 Algorytm Smitha Watermana implementacja w języku Python Przyrównanie sekwencji Algorytm Smitha-Watermana dla pary sekwencji P i Q o długościach odpowiednio M i N. Zbuduj macierz
Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej
Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej Specjacja } Pojawienie się bariery reprodukcyjnej między populacjami dające początek gatunkom } Specjacja allopatryczna
Bioinformatyka wykład 3.I.2008
Bioinformatyka wykład 3.I.2008 Białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 2008-01-03 1 Plan wykładu analiza i porównywanie struktur białek. doświadczalne metody badania struktur
Bioinformatyka wykład 8, 27.XI.2012
Bioinformatyka wykład 8, 27.XI.2012 białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 2013-01-21 1 Plan wykładu regiony nieuporządkowane sposoby przedstawienia struktur białkowych powierzchnia
Bioinformatyka Laboratorium, 30h. Michał Bereta
Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecnośd Literatura, materiały i ewolucja molekularna
Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.
Ćwiczenie 5/6 Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST. Prof. dr hab. Roman Zieliński 1. Informacja genetyczna u
Algorytmy kombinatoryczne w bioinformatyce
lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie
Ewolucja informacji genetycznej
1 Ewolucja informacji genetycznej Czym jest życie? metabolizm + informacja (replikacja) Cząsteczki organiczne mog y powstać w atmosferze pierwotnej Ziemi Oparin, Haldane Miller, 1953 Co by o najpierw?
D: Dopasowanie sekwencji. Programowanie dynamiczne
D: Dopasowanie sekwencji. Programowanie dynamiczne Problem: jak porównywać sekwencje DNA? Czy te sekwencje są podobne? Jeśli są podobne, to jak mierzyć to podobieństwo? Odpowiedzi są kluczowe dla konstrukcji
Badanie doboru naturalnego na poziomie molekularnym
Badanie doboru naturalnego na poziomie molekularnym Podstawy ewolucji molekulanej Jak ewoluują sekwencje Zmiany genetyczne w ewolucji Mutacje tworzą nowe allele genów Inwersje zmieniają układ genów na
3 Przeszukiwanie baz danych
Spis treści 3 Przeszukiwanie baz danych 1 3.1 Heurystyczne algorytmy...................... 1 3.1.1 FASTA........................... 1 3.1.2 BLAST........................... 3 3.2 Macierze substytucyjne.......................
Bioinformatyka II Modelowanie struktury białek
Bioinformatyka II Modelowanie struktury białek 1. Który spośród wymienionych szablonów wybierzesz do modelowania dla każdego z podanych przypadków? Dlaczego? Struktura krystaliczną czy NMR (to samo białko,
Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???
Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*
Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz
Ewolucja molekularna człowieka okiem bioinformatyka Justyna Wojtczak Jarosław Jeleniewicz Informatyka w biologii - bioinformatyka Jest to szeroka dziedzina zajmująca się tworzeniem zaawansowanych baz danych,
Podstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek
Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Podręczniki Populacja Grupa krzyżujących się ze sobą osobników oraz ich potomstwo Zbiór wszystkich alleli populacji pula genowa Najprostszy
PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA
PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa - przykłady 4. Etapy konstrukcji drzewa
października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II
10 października 2013: Elementarz biologii molekularnej www.bioalgorithms.info Wykład nr 2 BIOINFORMATYKA rok II Komórka: strukturalna i funkcjonalne jednostka organizmu żywego Jądro komórkowe: chroniona
Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???
Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.
Podstawy biologii Informacja genetyczna. Co to jest ewolucja. Materiał genetyczny Materiałem genetycznym są kwasy nukleinowe Materiałem genetycznym organizmów komórkowych jest kwas deoksyrybonukleinowy
Nuttall przeprowadził testy precypitacyjne białek surowicy, aby wykazać związek filogenetyczny między różnymi grupami zwierząt.
1904 Nuttall przeprowadził testy precypitacyjne białek surowicy, aby wykazać związek filogenetyczny między różnymi grupami zwierząt. M. Prakash 2007.Encyclopaedia of Gene Evolution Vol. 2, Molecular Genetics,
Definicja pliku kratowego
Pliki kratowe Definicja pliku kratowego Plik kratowy (ang grid file) jest strukturą wspierająca realizację zapytań wielowymiarowych Uporządkowanie rekordów, zawierających dane wielowymiarowe w pliku kratowym,
Porównywanie sekwencji białek i kwasów nukleinowych
Porównywanie sekwencji białek i kwasów nukleinowych Krzysztof Lewiński 1. Podobieństwo i jego miara Wprawdzie podobieństwo jest pojęciem często używanym w życiu codziennym ale nie oznacza to, że możemy
Filogenetyka molekularna I
2 Literatura Krzysztof Spalik, Marcin Piwczyński (2009), Rekonstrukcja filogenezy i wnioskowanie filogenetyczne w badaniach ewolucyjnych, Kosmos 58(3-4): 485-498 Filogenetyka molekularna I John C. Avise
Filogenetyka molekularna. Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji
Filogenetyka molekularna Dr Anna Karnkowska Zakład Filogenetyki Molekularnej i Ewolucji Co to jest filogeneza? Filogeneza=drzewo filogenetyczne=drzewo rodowe=drzewo to rozgałęziający się diagram, który
Budowa aminokwasów i białek
Biofizyka Ćwiczenia 1. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas Budowa aminokwasów i białek E.Banachowicz 1 Ogólna budowa aminokwasów α w neutralnym p α N 2 COO N
Ewolucja informacji genetycznej
1 Ewolucja informacji genetycznej Czym jest życie? metabolizm + informacja (replikacja) Cząsteczki organiczne mogły powstać w atmosferze pierwotnej Ziemi Oparin, Haldane Miller, 1953 Co było najpierw?
MACIERZE MUTACYJNE W ANALIZIE GENOMÓW czy możliwa jest rekonstrukcja filogenetyczna? Aleksandra Nowicka
MAIERZE MUTAYJNE W ANALIZIE GENOMÓW czy możliwa jest rekonstrukcja filogenetyczna? Aleksandra Nowicka Zadaniem FILOGENETYKI jest : zrekonstruowanie ewolucyjnej historii wszystkich organizmów odkrycie przodka
Bioinformatyka wykład 9
Bioinformatyka wykład 9 14.XII.21 białkowa bioinformatyka strukturalna krzysztof_pawlowski@sggw.pl 211-1-17 1 Plan wykładu struktury białek dlaczego? struktury białek geometria i fizyka modyfikacje kowalencyjne
Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova
Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova M. Czoków, J. Piersa 2010-12-21 1 Definicja Własności Losowanie z rozkładu dyskretnego 2 3 Łańcuch Markova Definicja Własności Losowanie z rozkładu
BUDOWA I FUNKCJA GENOMU LUDZKIEGO
BUDOWA I FUNKCJA GENOMU LUDZKIEGO Magdalena Mayer Katedra i Zakład Genetyki Medycznej UM w Poznaniu 1. Projekt poznania genomu człowieka: Cele programu: - skonstruowanie szczegółowych map fizycznych i
Zmienność ewolucyjna. Ewolucja molekularna
Zmienność ewolucyjna Ewolucja molekularna Mechanizmy ewolucji Generujące zmienność mutacje rearanżacje genomu horyzontalny transfer genów Działające na warianty wytworzone przez zmienność dobór naturalny
Zmienność ewolucyjna. Ewolucja molekularna
Zmienność ewolucyjna Ewolucja molekularna Mechanizmy ewolucji Generujące zmienność mutacje rearanżacje genomu horyzontalny transfer genów Działające na warianty wytworzone przez zmienność dobór naturalny
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Wykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa
Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa M. Czoków, J. Piersa 2012-01-10 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego 3 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego
WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19
WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19 Witold Dyrka 14 marca 2019 1 Wprowadzenie 1.1 Definicje bioinformatyki Według polskiej Wikipedii [1], Bioinformatyka interdyscyplinarna dziedzina
Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.
Podstawy biologii Informacja genetyczna. Co to jest ewolucja. Zarys biologii molekularnej genu Podstawowe procesy genetyczne Replikacja powielanie informacji Ekspresja wyrażanie (realizowanie funkcji)