Spis treści 8 Ewolucja molekularna Ewolucyjne podstawy porównywania sekwencji Identyfikacja sekwencji i jej funkcji...
|
|
- Natalia Lisowska
- 8 lat temu
- Przeglądów:
Transkrypt
1 Spis treści 8 Ewolucja molekularna Ewolucyjne podstawy porównywania sekwencji Identyfikacja sekwencji i jej funkcji Homologia Modele ewolucji sekwencji białkowej Macierze identycznościowe Macierz PAM Macierze BLOSUM System kar za przerwy Statystyczne znaczenie dopasowań Domenowa budowa białek Porównywanie sekwencji Macierze punktowe Programowanie dynamiczne Statystyczne znaczenie dopasowań Zestwienia wielosekwencyjne Zestawienie wielosekwencyjne: Punktacja (Scoring ) Bazy domen i rodzin białkowych Metody heurystyczne FASTA BLAST Skrypt Bioinformatyka DRAFT Strona 85
2 Skrypt Bioinformatyka DRAFT Strona 86
3 8 Ewolucja molekularna 9 Ewolucyjne podstawy porównywania sekwencji Pierwsze pytanie biologa molekularnego, kiedy odkryje nową sekwencję: Czy w bazie sekwencji są już sekwencje podobne? Celem porównania białek jest między innymi przypisanie informacji znanej dla jednej cząsteczki drugiej cząsteczce (genomika/proteomika porównawcza) - identyfikacja przez porównanie z innymi sekwencjami. Sekwencje są identyczne nic nowego. Sekwencja jest podobna (ma krewnych ) nowy członek znanej rodziny Sekwencja ma kilka podobnych regionów, motywów lub domen można zaproponować funkcję Nie ma znaczącego podobieństwa dużo pracy, trzeba eksperymentalnie dowieść funcji. 9.1 Identyfikacja sekwencji i jej funkcji Białka spokrewnione ze sobą (posiadające wspólnego przodka) mają podobne sekwencje, strukturę i funkcję Pewne istotne fragmenty (motywy) są konserwatywne i charakteryzują rodzinę białek (Bazy rodzin białkowych: PROSITE, PRINTS, InterPro) Ale: czy wszystkie białka spokrewnione mają tę samą funkcję? czy podobieństwo krótkich fragmentów może być przypadkowe? czy wszystkie białka pełniące tę samą funkcje muszą być spokrewnione? Ewolucyjne podstawy porównywania sekwencji Skrypt Bioinformatyka DRAFT Strona 87
4 Nic w Biologii (Bioinformatyce) nie ma sensu jeśli rozpatruje się to w oderwaniu od ewolucji. Theodosis Dobzhansky ( ) 9.2 Homologia homologia -podobieństwo ze względu na wspólnego przodka (dywergencja) homoplazja podobieństwo ze względu na konwergencję Dywergencja rozwoju - w rozwoju ewolucyjnym różnokierunkowe kształtowanie się narządu lub postaci osobników jakiegoś szczepu, wskutek działania odmiennych warunków środowiskowych; np. dywergencja rozwoju kończyn ssaków. Źródło Konwergencja (łac. convergere, zbierać się, upodabniać się) - w biologii, proces powstawania morfologicznie i funkcjonalnie podobnych cech (czyli analogicznych) w grupach organizmów odlegle spokrewnionych (niezależnie w różnych liniach ewolucyjnych), odrębnych dla tych grup cech pierwotnych, w odpowiedzi na podobne lub takie same wymagania środowiskowe, np. podobny typ pokarmu, wymagania lokomocyjne Sekwencje homologiczne są podobne, ale sekwencje podobne nie muszą być homologiczne! Homologia = wspólny przodek Skrypt Bioinformatyka DRAFT Strona 88
5 Homologi: paralogi (wspólny przodek w czasie duplikacji) ortologi (wspólny przodek w czasie specjacji: a1-a2) Przykłady homologów: Hemoglobina (łańcuch α), Mioglobina, Leghemoglobina Skrypt Bioinformatyka DRAFT Strona 89
6 Rysunek: Molecular Cell Biology,4ed. Lodish, Berk, Matsudaira, Kaiser, Krieger, Scott, Zipursky, and Darnell Rysunek: (Biochemistry, J.Berg, J.Tymoczko, L.Stryer.,PWN 2005). homologi: ortologi -różne gatunki, taka sama funkcja (specjacja) paralogi-podobna funkcja, ale ewoluowały niezależnie (duplikacja,ten sam organizm) analogi: różne sekwencje, różne motywy, ale identyczna orientacja ważnych aminokwasów Skrypt Bioinformatyka DRAFT Strona 90
7 Homologia podobne funkcje, konserwatywność fragmentów Tryspsyna (myszy) P07146 i trypsyna (langusty) P Skrypt Bioinformatyka DRAFT Strona 91
8 Homologia nie zawsze podobne funkcje 1a4v.pdb 5lyz.pdb Skrypt Bioinformatyka DRAFT Strona 92
9 Homologia nie zawsze podobne funkcje Zeta-krystalina (soczewka oka kręgowców, human) Q08257, Oksydoreduktaza chininowa (E.Coli) P28304 Analogi Triose phosphate isomerase, i 1,4 - beta - xylanase Triose-phosphate isomerase (TPI or TIM), is an enzyme (EC ) that catalyzes the reversible interconversion of the triose phosphate isomers dihydroxyacetone phosphate and D-glyceraldehyde 3-phosphate. Xylanase (EC ) is the name given to a class of enzymes which degrade the linear polysaccharide beta-1,4-xylan into xylose [1], thus breaking down hemicellulose, which is a major component of the cell wall of plants. Skrypt Bioinformatyka DRAFT Strona 93
10 Proteazy serynowe hydrolizujące wiązanie peptydowe Chymotrypsin: His57, Asp102, Ser195 Subtilisin: His64, Asp32, Ser Modele ewolucji sekwencji białkowej Czy gen człowieka jest bardziej podobny do genu szympansa czy goryla? Potrzebny jest ilościowy model ewolucji. Np. wyznaczenie dopasowania sekwencji i obliczenie odsetka pozycji, na których wystąpiły różnice. S punktacja za dopasowanie, Score = Max(S) S = (dopasowania) - (niedopasowania) - (przerwy) Wartości substytucji i kary za przerwy Schemat punktacji bardziej złożony: macierze substytucji Skrypt Bioinformatyka DRAFT Strona 94
11 9.3.1 Macierze identycznościowe [...] Macierz PAM PAM (point accepted mutations = punktowe mutacje utrwalone) macierz uwzględniająca tempo i typ możliwych podstawień aminokwasowych. (1 jednostka PAM- stopień zróznicowania ewolucyjnego, w którym zmienił się 1% aminokwasów) M M ij ij P ( t) ij A N ij i P ij (t)- prawdopodobieństwo zamiany aminokwasu i na j w czasie t δt - tempo zmian aminokwasów(1 jednostka PAM- stopień zróżnicowania ewolucyjnego, w którym zmienił się 1% aminokwasów) N i - częstość zmian przypadkowych częstość tła (liczba wystąpień i w całym zbiorze sekwencji) A ij - częstość substytucji częstość docelowa zmiany pojawiające się w białkach spokrewnionych (liczba obserwowanych podstawień) Skrypt Bioinformatyka DRAFT Strona 95
12 Macierz PAM250 wartości w macierzy są proporcjonalne do logarytmu z (cz. docelowej/cz.tła) zbudowana na podstawie analizy par blisko spokrewnionych (1PAM) i ekstrapolowana do 250PAM ekstrapolacje można przeprowadzić dla różnych odległości ewolucyjnych PAM duże PAM stosuje się do porównywania sekwencji o dużym stopniu dywergencji ewolucyjnej małe PAM do badania sekwencji podobnych Skrypt Bioinformatyka DRAFT Strona 96
13 Dayhoff Macierz PAM250, substytucja F Y Macierz PAM250, substytucja W W Skrypt Bioinformatyka DRAFT Strona 97
14 fragment macierz PAM250 - substytucja A A skład aminokwasowy białek {Argos and McCaldon} Skrypt Bioinformatyka DRAFT Strona 98
15 Macierz substytucji a właściwości fizykochemiczne. Skrypt Bioinformatyka DRAFT Strona 99
16 9.3.3 Macierze BLOSUM Powstały w oparciu o bazę BLOCKS dopasowanie sekwencji daleko spokrewnionych (oszacowanie częstotliwości docelowych, bez modelu ewolucyjnego) Rodzina macierzy: różnice (indeksu) związane są z maksymalnym stopniem identyczności sekwencji wziętych do obliczeń () BLOSUM90 do analizy sekwencji blisko spokrewnionych BOLSUM30 do analizy odległych ewolucyjnie sekwencji BLOSUM62 Skrypt Bioinformatyka DRAFT Strona 100
17 Reprezentacja macierzy BLOSUM 62 DEHKR naładowane NQST polarne ACGP hydrofobowe FILMVWY duże i hydrofobowe (Biochemistry, Berg, Jeremy M.; Tymoczko, John L.; and Stryer, Lubert. New York: W. H. Freeman and Co.; (2002), Rys.7.9 ) System kar za przerwy nie-afiniczne kary za przerwy każda przerwa traktowana jest tak samo afiniczny model kar za przerwy: G + Ln, G- utworzenie przerwy, Ln-wydłużenie przerwy Skrypt Bioinformatyka DRAFT Strona 101
18 9.3.5 Statystyczne znaczenie dopasowań jaka jest wartość/ istotność dopasowania? Jaka jest wartość świadczy o homologii, a jaka o przypadkowym podobieństwie? Istotność dopasowania można ocenić przez porównanie obliczonej wartości dla danego dopasowania z wartościami obliczonymi dla wielu dopasowań przypadkowych sekwencji o podobnym składzie i długości np. dopasowanie sekwencji α hemoglobiny ludzkiej i mioglobiny ludzkiej Skrypt Bioinformatyka DRAFT Strona 102
19 przypadkowe sekwencje o podobnym składzie: sekwencja jednego z białek zostaje wielokrotnie potasowna Skrypt Bioinformatyka DRAFT Strona 103
20 Dla sekwencji dłuższych niż 100 aminokwasów identyczność wyższa niż 25% prawie na pewno nie jest przypadkowa prawdopodobieństwo homologii identyczność niższa niż 15% mało prawdopodobne, żeby podobieństwo było statystycznie istotne Brak statystycznej istotności nie wyklucza homologii Wykorzystanie macierzy substytucji do szukania dalekich krewnych. Skrypt Bioinformatyka DRAFT Strona 104
21 9.4 Domenowa budowa białek Kolejny aspekt ewolucyny, który musi zostać uwzględniony w czasie porównywania sekwencji: Domenowa budowa białek Tasowanie domen Skrypt Bioinformatyka DRAFT Strona 105
22 dopasowanie globalne dopasowanie wzdłuż całej sekwencji (zastosowanie: do białek składających się z pojedynczej domeny lub homologicznych słabo zróżnicowanych) dopasowanie lokalne uwzględnia domenową naturę białek, szuka subsekwencji (zastosowanie: do białek wielodomenowych, mrna z sekwencją genomową) 10 Porównywanie sekwencji Porównanie sekwencji odbywa się przez ich zestawienie = uliniowienie = alignment. Ogólne spojrzenie na problem. BLAST2Sequences: Algorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne (BLAST, FASTA) metody statystyczne (modele Markova, statystyka Bayesa) 10.1 Macierze punktowe Macierze punktowe nazywane także Dot Matrix Plots, albo DotPlots opierają się na wizualnej analizie podobieństwa. W niektórych przypadkach sprawdzają się lepiej niż zestawienia liniowe sekwencji. Są bardzo czułe na powtarzające się fragmenty sekwencji i dlatego przydatne są do wykrywania powtórzeń, rearanżacji i podobieństw lokalnych. Najczęściej wykorzystywane do porównywania RNA. Skrypt Bioinformatyka DRAFT Strona 106
23 DotPlot Dotter: : Dotter niektóre układy punktów tworzą ścieżkę każda ścieżka odpowiada jednemu dopasowaniu DotPlot- Dotter Dotter: wykrywają fragmenty powtarzalne i rearanżacje opierają się na ocenie wizualnej czasami skuteczniejszej niż alignment idealny do szukania lokalnego podobieństwa Dotter - sekwencje Dotter - sekwencje Dotter SMART ( Liniowe zestawienie dwóch sekwencji Pairwise Sequence Alignment Skrypt Bioinformatyka DRAFT Strona 107
24 Punktownia przerw programowanie dynamiczne Najlepsza ścieżka Najlepsza ścieżka? Algorytm Needlemana-Wunscha strategia najlepszej ścieżki programowanie dynamiczne przeszukiwanie dotyczy pełnego zakresu sekwencji (obszaru dopasowania)- dopasowanie globalne każda podścieżka stanowić może fragment optymalnej ścieżki. Ścieżki szuka się poszerzając zakres podscieżek. Algorytm Smitha-Watermana dopasowanie lokalne ścieżka dopasowania nie musi osiągać krawędzi analizowanej sekwencji ścieżka jest lokalnie optymalna jeśli jej wydłużanie/skracanie nie poprawia obliczonej dla niej wartości system wartościowania dopasowania zaniża wartości w regionach słabego dopasowania = przerwanie ścieżki mogą istnieć ścieżki złożone z kilku połączonych ścieżek Szukanie wielu dopasowań -subdopasowania Metoda optymalna daje zawsze najlepsze dopasowanie nawet jeśli nie ma ono znaczenia biologicznego znaczących, niezachodzących na siebie dopasowń lokalnych można naleźć kilka subdopasownia Trzeba szukać więcej niż jednego dopasowania! (lalign, SIM) Dopasowanie optymalne i suboptymalne Dopasowanie optymalne Skrypt Bioinformatyka DRAFT Strona 108
25 i suboptymalne SIM Wartości substytucji i kary za przerwy schemat wartościowania I: (match) dopasowany: +1 (mismatch) niedopasowany: -1 (gap) przerwa: -1 (nie-afiniczne kary za przerwy każda przerwa traktowana jest tak samo) Punktacja Punktowanie przerw non-affine model (nieafinicznie): równo (match:4, mismatch:-3, gap:-4) affine model (afinicznie): G + L n (match:4, mismatch:-3, gap creation:-8, gap:-4) Programowanie dynamiczne najlepsza ścieżka schemat wartościowania I: (match) dopasowany: +1 (mismatch) niedopasowany: -1 (gap) przerwa: -1 (nie-afiniczne kary za przerwy każda przerwa traktowana jest tak samo) od tego miejsca tekst jest wklejony bezpośrednio z prezentacji i nie przetworzony - w trakcie tworzenia! 10.2 Programowanie dynamiczne zasady: Skrypt Bioinformatyka DRAFT Strona 109
26 Programowanie dynamiczne Programowanie dynamiczne - pseudokody 10.3 Statystyczne znaczenie dopasowań jaka jest wartość/ istotność dopasowania? 10.4 Zestwienia wielosekwencyjne (Zestawienia wielosekwencyjne - Multiple Sequence Alignment -MSA) porównanie dwóch sekwencji: szukanie podobieństwa: przeniesienie informacji o strukturze i funkcji porównanie wielu sekwencji? znalezione podobieństwa mogą być bardziej istotne jeśli występują w wielu sekwencjach Kiedy? Tylko z sekwencjami homologicznymi Poco? wskazanie regionów podobnych, zróżnicowanych, domen oraz funkcyjnie istotnych motywów poprawienie przewidywania; poprawienie błędów! Skrypt Bioinformatyka DRAFT Strona 110
27 tworzenie sekwencji konsensusowej (uzgodnionej), odszukiwanie nowych motywów Jak? Metody automatyczne: Clustal, MAGI półautomatyczne: Hidden Markov Models (HMM) analiza ręczna : Jalview, Cinema Metody Automatyczna :Clustal W, MAGI (EBI) (PBIL) (EMBnet-CH) (MAGI) półautomatyczne: Hidden Markov Models (HMM) Ręczna analiza zestawienia: Jalview, Cinema Multiple Sequence Alignment (MSA) pozwala na znalezienie najbardziej podobnych fragmentów w zbiorze sekwencji o domeny funkcyjne o domeny strukturalne Jeśli struktura jednego z białek jest znana możliwe jest dopasowanie struktury do pozostałych członków zestawienia Różnica między zestawieniem wielu sekwencji (Multiple Sequence Alignment) a estawieniem pary (Sequence Pair Alignment) Podejście macierzowe = programowanie dynamiczne prowadzi do optymalnego zestawienia dwóch sekwencji. Dla zestawień wielosekwencyjnych trudne liczba porównań rośnie gwałtownie z liczbą sekwencji. MSA - dynamiczne Skrypt Bioinformatyka DRAFT Strona 111
28 Dodanie kolejnego zestawienia seq 1:seq 2 seq 2:seq 3 Skrypt Bioinformatyka DRAFT Strona 112
29 dla więcej niż 3 sekwencji potrzebna jest przestrzeń N wymiarowa Punktacja MSA punktacja każdego zestawienia dwóch sekwencji. Suma Par (SP score). stała kara za przerwy (Gaps-constant penalty) dla dowolnego rozmiaru przerwy. Uogólnienie zestawienia dwóch sekwencji Zestawienie 2 sekwencji jest reprezentowane przez macierz 2-wierszową Skrypt Bioinformatyka DRAFT Strona 113
30 Zestawienie 3 sekwencji jest reprezentowane przez macierz 3-wierszową A T - G C G - A - C G T - A A T C A C - A Punktacja (Score): im bardziej zachowane (conserved) kolumny tym lepsze zestawienia Alignments = ścieżka Zestawienie Siatka zestawienia 2-D i 3-D komórka 2-D i 3-D zestawienia Architektura komórki 3-D zestawienia Zasady programowania dynamicznego Multiple Alignment: Dynamic Programming Zasady programowania dynamicznego Multiple Alignment: Dynamic Programming Zasady programowania dynamicznego Multiple Alignment: Dynamic Programming Zestawienie wielosekwencyjne: czas obliczeń Dla 3 sekwencji o długości n, czas obliczeń wynosi 7n3; O(n3) dla k sekwencji, (2k-1)(nk); O(2knk) Programowanie dynamiczne można łatwo zastosować do zestawień wielosekwencyjnych, ale czas obliczeń rośnie ekspotencjalnie. Multiple sequence alignments Profile Profile Representation of Multiple Alignment Skrypt Bioinformatyka DRAFT Strona 114
31 Profil porównanie profili Oczywiste jest porównanie sekwencji do sekwencji. Czy można porównać/zestawić sekwencję z profilem? Czy można porównać/zestawić profil z profilem? Zestawianie zestawień Aligning alignments Zestawianie zestawień Aligning alignments Czy można porównać dwa zestawienia? zestawienia odpowiednich profili (zestawianie zestawień prowadzi do zestawienia wielosekwencyjnego nowy sposób?) Zestawienie wielosekwencyjne Multiple Alignment: Greedy Approach Podejście: Wybranie najbardziej podobnej pary łańcuchów i złożenie ich w jeden profil redukcja zestawienia k sekwencji do k-1 sekwencji/profili. To jest metoda heurystyczna (heuristic greedy method) Greedy Approach: Przykład Greedy Approach: Przykład = 6 możliwych zestawień Greedy Approach: Przykład Zestawienie progresywne Progressive Alignment Progressive alignment jest ulepszoną wersją zestawienia za pomocą podejścia greedy poprawiona strategia wybierania najlepszych sekwencji do zestawień Skrypt Bioinformatyka DRAFT Strona 115
32 Zestawienie progresywne dobrze działa dla podobnych sekwencji, gorzej dla odległych ClustalW numer jeden na świecie W oznacza ważone (różne fragmenty zestawienia mają różna wagę ). Trzy kroki: 1) Tworzenie zestwień dwóch sekwencji 2) Budowa Guide Tree (drzewo naprowadzające) 3) Zestawienie progresywne wykorzystujące drzewo Krok 1: Zestwienia dwusekwencyjne Zestawienie sekwencji każda z każdą macierz podobieostwa podobieństwo = identyczne / długość sekwencji (%identycznych) Krok 2: Drzewo (Guide Tree) Budowa drzewa na podstawie macierzy podobieństwa ClustalW stosuje metode łączenia sąsiadów (neighbor-joining) Drzewo (guide tree) odzwierciedla z grubsza związki ewolucyjne między sekwencjami Krok 2: Drzewo (Guide Tree) Krok 3: Zestwienie progresywne na początek dwie najbardziej podobne sekwencje Zgodnie z guide tree,dodawane są kolejne sekwencje, zestawiane z istniejącym zestwieniem Wstawianie przerw w razie potrzeby Zestawienie wielosekwencyjne: Punktacja (Scoring ) liczba dopasowań (punktacja najdłuższej wspólnej sekwencji) Entropia (Entropy score) Suma par (Sum of pairs, SP-Score) Punktacja najdłuższej wspólnej sekwencji Skrypt Bioinformatyka DRAFT Strona 116
33 Multiple LCS Score Entropia Określa częstotliwość z jaką każda litera pojawia się w każdej kolumnie zestawienia wielosekwencyjnego pa = 1, pt=pg=pc=0 (1. kolumna) pa = 0.75, pt = 0.25, pg=pc=0 (2.kolumna) pa = 0.50, pt = 0.25, pc=0.25 pg=0 (3. kolumna) entropie oblicza się dla każdej kolumny: Entropia: przykład Entropia zestawienia Multiple Alignment: Entropy Score Entropia zestawienia : przykład Zestawienie wielosekwencyjne generuje zestawienia par Każde zestawienie wielosekwencyjne prowadzi do zestawienia par x: AC-GCGG-C y: AC-GC-GAG z: GCCGC-GAG Pary: x: ACGCGG-C; x: AC-GCGG-C; y: AC-GCGAG y: ACGC-GAC; z: GCCGC-GAG; z: GCCGCGAG Zestawienie par z zestawienia wielosekwencyjnego da się wyprowadzić z każdego zestawienia wielosekwencyjnego, ale nie koniecznie będzie to zestawienie optymalne projekcja 3-D ścieżki zestawienia wielosekwencyjnego na 2-D powierzchnie sześcianu Skrypt Bioinformatyka DRAFT Strona 117
34 Projekcja zestawienia wielosekwencyjnego Suma Punktacji Par (SP-Score) zestawienie dwóch sekwencji ai i aj uzyskane w zestawieniu wielosekwencyjnym k sekwencji Nieoptymalna punktacja tej pary: s*(ai, aj) suma punktacji wszystkich par: s(a1,,ak) = Σi,j s*(ai, aj) Obliczanie SP-Score SP-Score: Przykład Problems with Multiple Alignment Multidomain proteins evolve not only through point mutations but also through domain duplications and domain recombinations Although MSA is a 30 year old problem, there were no MSA approaches for aligning rearranged sequences (i.e., multi-domain proteins with shuffled domains) prior to 2002 Often impossible to align all protein sequences throughout their entire length Problems with Multiple Alignment Multidomain proteins evolve not only through point mutations but also through domain duplications and domain recombinations Although MSA is a 30 year old problem, there were no MSA approaches for aligning rearranged sequences (i.e., multi-domain proteins with shuffled domains) prior to 2002 Often impossible to align all protein sequences throughout their entire length Źródło Chris Lee, POA, UCLA An introduction to Bioinformatics algorithms, N.C. Jones&P.A.Pevzner Do czego prowadzą zestawienia wielosekwencyjne Skrypt Bioinformatyka DRAFT Strona 118
35 (MSA) wykrywanie zachowawczych(zakonserwowanych) regionów w sekwencjach i budowania ich modeli: Consensus sequences (uzgodnione, zachowacze sekwencje) Patterns (wzorce) Position Specific Score Matrices (PSSMs), Profiles (profile) etc. Sekwencja konsensusowa Pattern (wzorzec) zbiór alternatywnych sekwencji wyrażony za pomocą: regular expression Prosite ( The Prosite syntax for patterns uses the standard IUPAC one-letter codes for amino acids (G=Gly, P=Pro,...), each element in a pattern is separated from its neighbor by a -, the symbol X is used where any amino acid is accepted, ambiguities are indicated by square parentheses [ ] ([AG] means Ala or Gly), amino acids that are not accepted at a given position are listed between a pair of curly brackets {} ({AG} means any amino acid except Ala and Gly), repetitions are indicated between parentheses ( ) ([AG](2,4) means Ala or Gly between2 and 4 times, X(2) means any amino acid twice, a pattern is anchored to the N-term and/or C-term by the symbols < and > respectively. Definiowanie matryc sekwencji -Patterns Sposób zapisu matrycy (wzorca): motyw receptora jadrowego: C-x(2)-C-x-[DE]-x(5)-[HN]-[FY]-x(4)-C-x(2)-C-x(2)-F-F-x-R [DE]: D lub E x(5): 5 niezdefiniowanych, dowolnych pozycji {FYW}: dowolny niearomatyczny aminokwas Skrypt Bioinformatyka DRAFT Strona 119
36 Pattern - wzorzec <A-x-[ST](2)-x(0,1)-{V} Ala na końcu N-, dowolny aminokwas, Ser lub Thr (razy 2), 0 lub dowolny aminokwas, dowolny aminokwas z wyjątkiemval Bazy domen i rodzin białkowych Databases of protein domains and families InterPro - Integrated Resources of Proteins Domains and Functional Sites PROSITE - PROSITE dictionary of protein sites and patterns BLOCKS - BLOCKS db Pfam - Protein families db (HMM derived) [Mirrors at St. Louis (USA), Sanger Institute, UK, Karolinska Institutet (Sweden)] PRINTS - Protein Motif fingerprint db ProDom - Protein domain db (Automatically generated) PROTOMAP - An automatic hierarchical classification of Swiss-Prot proteins SBASE - SBASE domain db SMART - Simple Modular Architecture Research Tool STRING - Search Tool for the Retrieval of Interacting Genes/Proteins TIGRFAMs - TIGR protein families db 10.5 Metody heurystyczne Heurystyczny - pomocny w rozwiązaniu, służący odkryciu, przeciwstawienie ślepego szukania, ale nie gwarantujący rozwiązania. FASTA i BLAST Metody dynamiczne dobre są do zestawienia (porównania) dwóch sekwencji FASTA i BLAST Skrypt Bioinformatyka DRAFT Strona 120
37 Rozmiar baz danych (rośnie ekspotencjalnie) białkowa: ok reszt aminokwasowych nukleotydowa: nukleotydów FASTA i BLAST wspólna strategia: szybkie przejrzenie bazy sekwencji wyeliminowanie sekwencji niepodobnych zestawienie (alignment) najlepszych FASTA website: ftp://ftp.virginia.edu/pub/fasta web-interface: FASTA Założenie: sekwencje podobne posiadają przekątne o wysokim podobieństwie FASTA Strategia: 4 etapy znalezienie najlepszych regionów na przekątnych powtórne sprawdzenie 10 najlepszych regionów przy użyciu macierzy PAM połączenie wybranych regionów obliczenie optymalnego zestawienia za pomocą programowania dynamicznego ekstra. obliczenie istotności punktacji zestawienia FASTA etap 1 znalezienie najlepszych regionów na przekątnej za pomocą tabel lookup table (lookup table lista wszystkich słów o zadanej długości ktup i ich pozycji w sekwencjach) FASTA etap 1 znalezienie najlepszych regionów na przekątnej za pomocą tabel lookup table (lookup table lista wszystkich słów o zadanej długości ktup i ich pozycji w sekwencjach) FASTA etap 1 Skrypt Bioinformatyka DRAFT Strona 121
38 FASTA etap 2 dla każdego regionu obliczana jest punktacja (PAM250) lokalne podobieństwo (punkty za identyczność, kary za zamianę) 10 najlepszych regionów przechodzi do etapu 2 ponowne obliczenie punktacji z macierzą PAM250 (lub BLOSUM50) lokalne podobieństwo bez przerw. dla każedego regionu znaleziona jest subsekwencja z maksymalną punktacja (init1) przycięcie regionu FASTA etap 3 łączenie przekątnych (próba łączenia przyciętych regionów zestawienie z przerwami) FASTA etap 4 tworzenie zestawienia całkowitego za pomocą lokalnego programowania dynamicznego (NWS Needleman-Wunch-Sellers) FASTA etap 4/ekstra oszacowanie istotności porównania FASTA - zastosowanie przykład: ECGF1 (GI ) Visual FASTA FASTA - Results Visual FASTA FASTA Alignments display FASTA - MView BLAST Basic Lolcal Alignment Search Tool BLAST oparty na wynikach statystycznych dystrybucji punktacji lokalnych zestawień P(S>x) = 1- exp(-kmne-λx) Skrypt Bioinformatyka DRAFT Strona 122
39 BLAST dla nukleotydów - BLASTn podzielenie query na nakładające się słowa przeszukanie bazy szukanie słów o długości W wydłużenie zestawienia od słowa identycznego tworzenie MSP (maximal segment pair), obliczenie istotności dla MSP lokalne programowanie dynamiczne wokół MSP BLAST dla białek - BLASTp podzielenie query na nakładające się słowa określenie słów pokrewnych i przeszukanie bazy szukanie słów wydłużenie zestawienia od słowa identycznego tworzenie MSP (matching segment pair), obliczenie istotności dla MSP lokalne programowanie dynamiczne wokół MSP BLASTp etap 1 BLASTp etap 2 słowa pokrewne BLASTp etap 2 BLAST - etap 2 BLAST zależność od wartości T BLAST etap 3 BLASTp etap 3 BLAST etap 4 podobnie jak dla FASTA programowanie dynamiczne (Smith-Waterman) wokół HSP statystyczne szacowanie istotności zestawienia BLAST etap 4 BLAST etap 4 Rodzaje BLASTów Rodzaje BLASTów BLAST - praktyka przykład: DNA Skrypt Bioinformatyka DRAFT Strona 123
Wykład 10 2008-04-30. Bioinformatyka. Wykład 9. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM
Bioinformatyka Wykład 9 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Konsekwencje zestawieo wielu sekwencji - rodziny białkowe, domeny, motywy i wzorce 2 Bioinformatyka,
Bardziej szczegółowoBioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM
Bioinformatyka (wykład monograficzny) wykład 5. E. Banachowicz Zakład Biofizyki Molekularnej IF UM http://www.amu.edu.pl/~ewas lgorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne
Bardziej szczegółowoDopasowanie sekwencji (sequence alignment)
Co to jest alignment? Dopasowanie sekwencji (sequence alignment) Alignment jest sposobem dopasowania struktur pierwszorzędowych DNA, RNA lub białek do zidentyfikowanych regionów w celu określenia podobieństwa;
Bardziej szczegółowoPRZYRÓWNANIE SEKWENCJI
http://theta.edu.pl/ Podstawy Bioinformatyki III PRZYRÓWNANIE SEKWENCJI 1 Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych), które posiadają
Bardziej szczegółowoPrzyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Przyrównanie sekwencji Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych),
Bardziej szczegółowoBioinformatyka. Porównywanie sekwencji
Bioinformatyka Wykład 5 E. Banachowicz Zakład Biofizyki Molekularnej IF UM 1 http://www.amu.edu.pl/~ewas Porównywanie sekwencji Pierwsze pytanie biologa molekularnego, kiedy odkryje nową sekwencję: zy
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów
Bardziej szczegółowoPorównywanie sekwencji białkowych
Bioinformatyka -9 Bioinformatyka Wykład 4. E. Banachowicz Zakład Biofizyki Molekularnej http://www.amu.edu.pl/~ewas Porównywanie sekwencji białkowych Wykład 4, Bioinformatyka -9 Porównywanie sekwencji
Bardziej szczegółowoBioinformatyka Bioinformatyka. Wykład 6. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM
Bioinformatyka Wykład 6 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Algorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne (BLAST, FASTA)
Bardziej szczegółowoPorównywanie i dopasowywanie sekwencji
Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek pojawiła się nowa możliwość śledzenia ewolucji na poziomie molekularnym Ewolucja
Bardziej szczegółowoPorównywanie i dopasowywanie sekwencji
Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek narodziła się nowa dyscyplina nauki ewolucja molekularna Ewolucja molekularna
Bardziej szczegółowoDopasowania par sekwencji DNA
Dopasowania par sekwencji DNA Tworzenie uliniowień (dopasowań, tzw. alignmentów ) par sekwencji PSA Pairwise Sequence Alignment Dopasowania globalne i lokalne ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA
Bardziej szczegółowoBioinformatyka Laboratorium, 30h. Michał Bereta
Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Często dopasować chcemy nie dwie sekwencje ale kilkanaście lub więcej 2 Istnieją dokładne algorytmy, lecz są one niewydajne
Bardziej szczegółowoDopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania
Wprowadzenie do Informatyki Biomedycznej Wykład 2: Metody dopasowywania sekwencji Wydział Informatyki PB Dopasowywanie sekwencji (ang. sequence alignment) Dopasowywanie (przyrównywanie) sekwencji polega
Bardziej szczegółowoDopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010)
Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie
Bardziej szczegółowoDopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012)
Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie
Bardziej szczegółowoSpis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych...
Przedmowa... XI Część pierwsza Wprowadzenie i biologiczne bazy danych 1 Wprowadzenie... 3 Czym jest bioinformatyka?... 5 Cele... 5 Zakres zainteresowań... 6 Zastosowania... 7 Ograniczenia... 8 Przyszłe
Bardziej szczegółowoPrzyrównywanie sekwencji
Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański Przyrównywanie sekwencji 1. Porównywanie sekwencji wprowadzenie Sekwencje porównujemy po to, aby
Bardziej szczegółowoBioinformatyka Laboratorium, 30h. Michał Bereta
Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Wyszukiwanie sekwencji Jak wyszukad z baz danych bioinformatycznych sekwencje podobne do sekwencji zadanej (ang. query
Bardziej szczegółowoPolitechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment
Dopasowywanie sekwencji Sequence alignment Drzewo filogenetyczne Kserokopiarka zadanie: skopiować 300 stron. Co może pójść źle? 2x ta sama strona Opuszczona strona Nadmiarowa pusta strona Strona do góry
Bardziej szczegółowoStatystyczna analiza danych
Statystyczna analiza danych ukryte modele Markowa, zastosowania Anna Gambin Instytut Informatyki Uniwersytet Warszawski plan na dziś Ukryte modele Markowa w praktyce modelowania rodzin białek multiuliniowienia
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW
PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW DOPASOWYWANIE SEKWENCJI 1. Miary podobieństwa sekwencji aminokwasów 2. Zastosowanie programów: CLUSTAL OMEGA BLAST Copyright 2013, Joanna Szyda
Bardziej szczegółowodopasowanie sekwencji Porównywanie sekwencji Etapy dopasowywania sekwencji Homologia, podobieństwo i analogia
Porównywanie sekwencji Homologia, podobieństwo i analogia dopasowanie sekwencji Dopasowanie/porównywanie Uliniowienie Alignment W bioinformatyce, dopasowanie sekwencji jest sposobem dopasowania struktur
Bardziej szczegółowoBioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee
Bioinformatyka 2 (BT172) Wykład 5 Progresywne metody wyznaczania MSA: T-coffee Krzysztof Murzyn 14.XI.2005 PLAN WYKŁADU Ostatnio : definicje, zastosowania MSA, złożoność obliczeniowa algorytmu wyznaczania
Bardziej szczegółowoWykład 5 Dopasowywanie lokalne
Wykład 5 Dopasowywanie lokalne Dopasowanie par (sekwencji) Dopasowanie globalne C A T W A L K C A T W A L K C O W A R D C X X O X W X A X R X D X Globalne dopasowanie Schemat punktowania (uproszczony)
Bardziej szczegółowoWstęp do Biologii Obliczeniowej
Wstęp do Biologii Obliczeniowej Zagadnienia na kolokwium Bartek Wilczyński 5. czerwca 2018 Sekwencje DNA i grafy Sekwencje w biologii, DNA, RNA, białka, alfabety, transkrypcja DNA RNA, translacja RNA białko,
Bardziej szczegółowoGenomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski
Genomika Porównawcza Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski 1 Plan prezentacji 1. Rodzaje i budowa drzew filogenetycznych 2. Metody ukorzeniania drzewa
Bardziej szczegółowoMultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński
MultiSETTER: web server for multiple RNA structure comparison Sandra Sobierajska Uniwersytet Jagielloński Wprowadzenie Budowa RNA: - struktura pierwszorzędowa sekwencja nukleotydów w łańcuchu: A, U, G,
Bardziej szczegółowoGenerator testów Bioinformatyka wer / 0 Strona: 1
Przedmiot: Nazwa przedmiotu Nazwa testu: Bioinformatyka wer. 1.0.6 Nr testu 0 Klasa: V zaoczne WNB UZ Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Analiza porównawcza białek zwykle zaczyna się na badaniach
Bardziej szczegółowoWykład Bioinformatyka 2012-09-24. Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki
Bioinformatyka Wykład 7 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Plan Bioinformatyka Ewolucyjne podstawy Bioinformatyki Filogenetyka Bioinformatyczne narzędzia
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA
PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa 4. Etapy konstrukcji drzewa filogenetycznego
Bardziej szczegółowoDopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl
Dopasowanie sekwencji c.d. Sequence alignment Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl dopasowanie - metody dopasowanie par sekwencji: Macierz punktów - dot matrix, dotplot Programowanie
Bardziej szczegółowoGenerator testów 1.3.1 Bioinformatyka_zdalne wer. 1.0.13 / 0 Strona: 1
Przedmiot: Bioinformatyka Nazwa testu: Bioinformatyka_zdalne wer. 1.0.13 Nr testu 0 Klasa: WNB UZ Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Model Markowa substytucji aminokwasów w mutagenezie białek zakłada...
Bardziej szczegółowoMSA i analizy filogenetyczne
Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański MSA i analizy filogenetyczne 1. Dopasowania wielosekwencyjne - wprowadzenie Dopasowanie wielosekwencyjne
Bardziej szczegółowoBioinformatyka. Podsumowanie algorytmów dynamicznych
Bioinformatyka Wykład 5 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas Podsumowanie algorytmów dynamicznych Algorytmy porównywania sekwencji oparte na programowaniu dynamicznym
Bardziej szczegółowoKonstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Konstruowanie drzew filogenetycznych Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Drzewa filogenetyczne ukorzenione i nieukorzenione binarność konstrukcji topologia (sposób rozgałęziana
Bardziej szczegółowo3 Przeszukiwanie baz danych
Spis treści 3 Przeszukiwanie baz danych 1 3.1 Heurystyczne algorytmy...................... 1 3.1.1 FASTA........................... 1 3.1.2 BLAST........................... 3 3.2 Macierze substytucyjne.......................
Bardziej szczegółowoDopasowanie par sekwencji
BIOINFORMTYK edycja 2016 / 2017 wykład 3 Dopasowanie par sekwencji dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Idea i cele dopasowania sekwencji 2. Definicje
Bardziej szczegółowoDopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl
Dopasowanie sekwencji c.d. Sequence alignment Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl Dopasowanie sekwencji - znaczenie Podobieństwo porównywanych sekwencji (similarity) może świadczyć
Bardziej szczegółowoplezjomorfie: podobieństwa dziedziczone po dalszych przodkach (c. atawistyczna)
Podobieństwa pomiędzy organizmami - cechy homologiczne: podobieństwa wynikające z dziedziczenia - apomorfie: podobieństwa dziedziczone po najbliższym przodku lub pojawiająca się de novo (c. ewolucyjnie
Bardziej szczegółowoBioinformatyka Laboratorium, 30h. Michał Bereta
Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Filogenetyka molekularna wykorzystuje informację zawartą w sekwencjach aminokwasów lub nukleotydów do kontrukcji drzew
Bardziej szczegółowoprof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji
Bioinformatyka wykład 5: dopasowanie sekwencji prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie podobieństwa sekwencji stanowi podstawę wielu gałęzi
Bardziej szczegółowoBioinformatyka 2 (BT172) Struktura i organizacja kursu
Bioinformatyka 2 (BT172) Wykład 1 Struktura i organizacja kursu dr Krzysztof Murzyn adiunkt w Zakładzie Biofizyki WBtUJ pok. B028, tel. 664-6379 10.X.2005 PODSTAWOWE INFORMACJE 9 godz. wykładów (45 min,
Bardziej szczegółowoHomologia, podobieństwo i analogia
Porównywanie sekwencji Homologia, podobieństwo i analogia Homologi Ortologi homologiczne geny, których rozdzielenie nastąpiło na skutek specjacji, czyli rozdzielenia gatunków, lub rzadziej horyzontalnego
Bardziej szczegółowoMotywy i podobieństwo
Motywy i podobieństwo Całość funkcja Modularna budowa białek Elementy składowe czyli miejsca wiązania, domeny 1 Motywy Motyw jest opisem określonej części trójwymiarowej struktury zawierającym charakterystyczny
Bardziej szczegółowoĆwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.
Ćwiczenie 5/6 Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST. Prof. dr hab. Roman Zieliński 1. Informacja genetyczna u
Bardziej szczegółowoBioinformatyka. Ocena wiarygodności dopasowania sekwencji.
Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie
Bardziej szczegółowoBioinformatyka wykład 8, 27.XI.2012
Bioinformatyka wykład 8, 27.XI.2012 białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 2013-01-21 1 Plan wykładu regiony nieuporządkowane sposoby przedstawienia struktur białkowych powierzchnia
Bardziej szczegółowoAcknowledgement. Drzewa filogenetyczne
Wykład 8 Drzewa Filogenetyczne Lokalizacja genów Some figures from: Acknowledgement M. Zvelebil, J.O. Baum, Introduction to Bioinformatics, Garland Science 2008 Tradycyjne drzewa pokrewieństwa Drzewa oparte
Bardziej szczegółowoBIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański
BIOINFORMATYKA edycja 2016 / 2017 wykład 11 RNA dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Rola i rodzaje RNA 2. Oddziaływania wewnątrzcząsteczkowe i struktury
Bardziej szczegółowoModelowanie motywów łańcuchami Markowa wyższego rzędu
Modelowanie motywów łańcuchami Markowa wyższego rzędu Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki 23 października 2008 roku Plan prezentacji 1 Źródła 2 Motywy i ich znaczenie Łańcuchy
Bardziej szczegółowoKsięgarnia PWN: Paul G. Higgs, Teresa K. Attwood - Bioinformatyka i ewolucja molekularna
Księgarnia PWN: Paul G. Higgs, Teresa K. Attwood - Bioinformatyka i ewolucja molekularna Przedmowa...................................................... 1 1. Rewolucja informatyczna w naukach biomedycznych...........................
Bardziej szczegółowoUrszula Poziomek, doradca metodyczny w zakresie biologii Materiał dydaktyczny przygotowany na konferencję z cyklu Na miarę Nobla, 14 stycznia 2010 r.
Ćwiczenie 1 1 Wstęp Rozważając możliwe powiązania filogenetyczne gatunków, systematyka porównuje dane molekularne. Najskuteczniejszym sposobem badania i weryfikacji różnych hipotez filogenetycznych jest
Bardziej szczegółowoWyszukiwanie podobnych sekwencji w bazach danych. Wyszukiwanie w sekwencji nukleotydów czy aminokwasów? Czułość i selektywność
Wersja 1.05 Wprowadzenie do Informatyki Biomedycznej Wykład 3: Wyszukiwanie w bazach sekwencji Przewidywanie genów Wydział Informatyki PB Marek Krętowski pokój 206 e-mail: m.kretowski@pb.edu.pl http://aragorn.pb.bialystok.pl/~mkret
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA
PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa - przykłady 4. Etapy konstrukcji drzewa
Bardziej szczegółowoZmienność ewolucyjna. Ewolucja molekularna
Zmienność ewolucyjna Ewolucja molekularna Mechanizmy ewolucji Generujące zmienność mutacje rearanżacje genomu horyzontalny transfer genów! Działające na warianty wytworzone przez zmienność dobór naturalny
Bardziej szczegółowoRMSD - Ocena jakości wybranych molekularnych struktur przestrzennych
RMSD - Ocena jakości wybranych molekularnych struktur przestrzennych Joanna Wiśniewska Promotor: dr inż. P. Łukasiak Spis treści 1. Zakres pracy magisterskiej 2. Struktura białka 3. Struktura kwasów nukleionowych
Bardziej szczegółowoBioinformatyka Laboratorium, 30h. Michał Bereta
Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecność Literatura, materiały Bioinformatyka i ewolucja
Bardziej szczegółowoBioinformatyka wykład 10
Bioinformatyka wykład 10 21.XII.2010 białkowa bioinformatyka strukturalna, c.d. krzysztof_pawlowski@sggw.pl 2011-01-17 1 Regiony nieuporządkowane disordered regions trudna definicja trudne do przewidzenia
Bardziej szczegółowoMechanizmy zmienności ewolucyjnej. Podstawy ewolucji molekularnej.
Mechanizmy zmienności ewolucyjnej Podstawy ewolucji molekularnej. Mechanizmy ewolucji } Generujące zmienność } mutacje } rearanżacje genomu } horyzontalny transfer genów } Działające na warianty wytworzone
Bardziej szczegółowoGenerator testów bioinformatyka wer / Strona: 1
Przedmiot: wyklad monograficzny Nazwa testu: bioinformatyka wer. 1.0.6 Nr testu 10469906 Klasa: 5 IBOS Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Aminokwas jest to związek organiczny zawierający A) grupę
Bardziej szczegółowopaździernika 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II
10 października 2013: Elementarz biologii molekularnej www.bioalgorithms.info Wykład nr 2 BIOINFORMATYKA rok II Komórka: strukturalna i funkcjonalne jednostka organizmu żywego Jądro komórkowe: chroniona
Bardziej szczegółowoEwolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz
Ewolucja molekularna człowieka okiem bioinformatyka Justyna Wojtczak Jarosław Jeleniewicz Informatyka w biologii - bioinformatyka Jest to szeroka dziedzina zajmująca się tworzeniem zaawansowanych baz danych,
Bardziej szczegółowoOcena jakości modeli strukturalnych białek w oparciu o podobieństwo strukturalne i semantyczny opis funkcji w ontologii GO
Ocena jakości modeli strukturalnych białek w oparciu o podobieństwo strukturalne i semantyczny opis funkcji w ontologii GO Bogumil Konopka 1, Jean-Christophe Nebel 2, Malgorzata Kotulska 1 * 1 Politechnika
Bardziej szczegółowoPodstawy bioinformatyki - biologiczne bazy danych
Podstawy bioinformatyki - biologiczne bazy danych Czym jest bioinformatyka? Bioinformatyka Bioinformatyka jest interdyscyplinarną dziedziną nauki obejmującą wykorzystanie metod obliczeniowych do badania
Bardziej szczegółowoD: Dopasowanie sekwencji. Programowanie dynamiczne
D: Dopasowanie sekwencji. Programowanie dynamiczne Problem: jak porównywać sekwencje DNA? Czy te sekwencje są podobne? Jeśli są podobne, to jak mierzyć to podobieństwo? Odpowiedzi są kluczowe dla konstrukcji
Bardziej szczegółowoSamouczek: Konstruujemy drzewo
ROZDZIAŁ 2 Samouczek: Konstruujemy drzewo Po co nam drzewa filogenetyczne? Drzewa filogenetyczne często pojawiają się dzisiaj w pracach z dziedziny biologii molekularnej, które nie mają związku z filogenetyką
Bardziej szczegółowoBioinformatyka wykład 3.I.2008
Bioinformatyka wykład 3.I.2008 Białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 2008-01-03 1 Plan wykładu analiza i porównywanie struktur białek. doświadczalne metody badania struktur
Bardziej szczegółowoAnalizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???
Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*
Bardziej szczegółowoBioinformatyka Laboratorium, 30h. Michał Bereta
Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecnośd Literatura, materiały i ewolucja molekularna
Bardziej szczegółowoPodstawy biologiczne - komórki. Podstawy biologiczne - cząsteczki. Model komórki eukariotycznej. Wprowadzenie do Informatyki Biomedycznej
Wprowadzenie do Informatyki Biomedycznej Wykład 1: Podstawy bioinformatyki Wydział Informatyki PB Podstawy biologiczne - komórki Wszystkie organizmy zbudowane są z komórek komórka jest skomplikowanym systemem
Bardziej szczegółowoĆwiczenia nr 5. Wykorzystanie baz danych i narzędzi analitycznych dostępnych online
Techniki molekularne ćw. 5 1 z 13 Ćwiczenia nr 5. Wykorzystanie baz danych i narzędzi analitycznych dostępnych online I. Zasoby NCBI Strona: http://www.ncbi.nlm.nih.gov/ stanowi punkt startowy dla eksploracji
Bardziej szczegółowoPodstawy bioinformatyki dla biotechnologów
dla biotechnologów Wykład 3 alignment Wykład 2 Porównywanie sekwencji Homologia, podobieństwo i analogia Wykład 2; slajd 2 Duplikacja, specjacja Wykład 2; slajd 3 Homologi Ortologi homologiczne geny, których
Bardziej szczegółowoBioinformatyczne bazy danych
Bioinformatyczne bazy danych Czym jest bioinformatyka? Bioinformatyka jest nauką integrującą różne dziedziny wiedzy Gruca (2010) Czym jest bioinformatyka? Bioinformatyka obejmuje technologie wykorzystujące
Bardziej szczegółowoBioinformatyka wykład 9
Bioinformatyka wykład 9 14.XII.21 białkowa bioinformatyka strukturalna krzysztof_pawlowski@sggw.pl 211-1-17 1 Plan wykładu struktury białek dlaczego? struktury białek geometria i fizyka modyfikacje kowalencyjne
Bardziej szczegółowoKsięgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka
Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka Słowo wstępne XIII Przedmowa XV 1. Bioinformatyka i Internet Andreas D. Baxevanis 1 1.1. Podstawy Internetu 2 1.2. Połączenie z Internetem
Bardziej szczegółowoAlgorytmika dla bioinformatyki
Algorytmika dla bioinformatyki kurs 2018/2019 Prof. Danuta Makowiec Instytut Fizyki Teoretycznej i Astrofizyki pok. 353, danuta.makowiec@gmail.com Cele kursu 2 Treści wykładu będą skoncentrowane wokół
Bardziej szczegółowoBioinformatyczne bazy danych
Bioinformatyczne bazy danych Czym jest bioinformatyka? Bioinformatyka jest nauką integrującą różne dziedziny wiedzy Gruca (2010) http://bioinformaticsonline.com/file/view/4482/bioinformatics-definitions-and-applications
Bardziej szczegółowoBioinformatyka II Modelowanie struktury białek
Bioinformatyka II Modelowanie struktury białek 1. Który spośród wymienionych szablonów wybierzesz do modelowania? Dlaczego? Struktura krystaliczną czy NMR (to samo białko, ta sama rozdzielczość)? Strukturę
Bardziej szczegółowoAlgorytmy kombinatoryczne w bioinformatyce
lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie
Bardziej szczegółowoBioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d.
Bioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 11.01.11 1 Dopasowanie strukturalne (alignment) odległość: d ij = (x i -x J ) 2 + (y i -y J ) 2
Bardziej szczegółowoAnalizy filogenetyczne
BIOINFORMATYKA edycja 2016 / 2017 wykład 6 Analizy filogenetyczne dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Cele i zastosowania 2. Podstawy ewolucyjne
Bardziej szczegółowoBIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE. Podstawy Bioinformatyki wykład 4
BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE Podstawy Bioinformatyki wykład 4 GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 2 GENOMY I ICH ADNOTACJE
Bardziej szczegółowoWybrane podstawowe rodzaje algorytmów
Wybrane podstawowe rodzaje algorytmów Tomasz Głowacki tglowacki@cs.put.poznan.pl Zajęcia finansowane z projektu "Rozwój i doskonalenie kształcenia na Politechnice Poznańskiej w zakresie technologii informatycznych
Bardziej szczegółowoBIOINFORMATYKA BIOLOGICZNE BAZY DANYCH
http://theta.edu.pl/ Podstawy Bioinformatyki II BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH 1 Czym jest bioinformatyka? 2 Bioinformatyka Bioinformatyka jest interdyscyplinarną dziedziną nauki obejmującą wykorzystanie
Bardziej szczegółowoAnalizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???
Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*
Bardziej szczegółowoFilogenetyka molekularna I. Krzysztof Spalik
Filogenetyka molekularna I Krzysztof Spalik Literatura Krzysztof Spalik, Marcin Piwczyński (2009), Rekonstrukcja filogenezy i wnioskowanie filogenetyczne w badaniach ewolucyjnych, Kosmos 58(3-4): 485-498
Bardziej szczegółowoPrzewidywanie struktury kanału białkowego z wykorzystaniem probabilistycznych gramatyk formalnych oraz modelu ciągłego przepływu jonów
Przewidywanie struktury kanału białkowego z wykorzystaniem probabilistycznych gramatyk formalnych oraz modelu ciągłego przepływu jonów Witold Dyrka Instytut Inżynierii Biomedycznej i Pomiarowej, Politechnika
Bardziej szczegółowoBIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE
BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE Podstawy Bioinformatyki wykład 2 PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 1 GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC PODSTAWY BIOINFORMATYKI
Bardziej szczegółowoBUDOWA I FUNKCJA GENOMU LUDZKIEGO
BUDOWA I FUNKCJA GENOMU LUDZKIEGO Magdalena Mayer Katedra i Zakład Genetyki Medycznej UM w Poznaniu 1. Projekt poznania genomu człowieka: Cele programu: - skonstruowanie szczegółowych map fizycznych i
Bardziej szczegółowoPorównywanie sekwencji białek i kwasów nukleinowych
Porównywanie sekwencji białek i kwasów nukleinowych Krzysztof Lewiński 1. Podobieństwo i jego miara Wprawdzie podobieństwo jest pojęciem często używanym w życiu codziennym ale nie oznacza to, że możemy
Bardziej szczegółowoFILOGENETYKA. Bioinformatyka, wykład. 8 c.d. 0)
FILOGENETYKA Bioinformatyka, wykład 8 c.d. (7.XII.2010) 0) krzysztof_pawlowski@sggw.pl Filogenetyka Cel rekonstrukcja historii ewolucji wszystkich organizmów. Klasyczne podejście: historia ewolucji jest
Bardziej szczegółowoTeoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej
Teoria ewolucji. Losy gatunków: specjacja i wymieranie. Podstawy ewolucji molekularnej Specjacja } Pojawienie się bariery reprodukcyjnej między populacjami dające początek gatunkom } Specjacja allopatryczna
Bardziej szczegółowoGrafy i sieci wybrane zagadnienia wykład 3: modele służące porównywaniu sieci
Grafy i sieci wybrane zagadnienia wykład 3: modele służące porównywaniu sieci prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Plan wykładu 1. Sieci jako modele interakcji
Bardziej szczegółowoEwolucja informacji genetycznej
1 Ewolucja informacji genetycznej Czym jest życie? metabolizm + informacja (replikacja) Cząsteczki organiczne mog y powstać w atmosferze pierwotnej Ziemi Oparin, Haldane Miller, 1953 Co by o najpierw?
Bardziej szczegółowoBioinformatyka. z sylabusu... (wykład monograficzny) wykład 1. E. Banachowicz. Wykład monograficzny Bioinformatyka.
Bioinformatyka (wykład monograficzny) wykład 1. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas z sylabusu... Wykład 1, 2006 1 Co to jest Bioinformatyka? Zastosowanie technologii
Bardziej szczegółowoBioinformatyka. z sylabusu...
Bioinformatyka Wykład 1. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas z sylabusu... Wykład 1, 2008 1 Co to jest Bioinformatyka? Zastosowanie technologii informacji do
Bardziej szczegółowoAlgorytmy kombinatoryczne w bioinformatyce
lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie
Bardziej szczegółowoPodstawy ewolucji molekularnej. Ewolucja sekwencji DNA i białek
Podstawy ewolucji molekularnej Ewolucja sekwencji DNA i białek Zmiany genetyczne w ewolucji } Mutacje } tworzą nowe allele genów } Inwersje } zmieniają układ genów na chromosomach } mogą uniemożliwić rekombinację
Bardziej szczegółowo