Bioinformatyka. Podsumowanie algorytmów dynamicznych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Bioinformatyka. Podsumowanie algorytmów dynamicznych"

Transkrypt

1 Bioinformatyka Wykład 5 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM Podsumowanie algorytmów dynamicznych Algorytmy porównywania sekwencji oparte na programowaniu dynamicznym gwarantują znalezienie optymalnego (najlepszego) zestawienia dwóch sekwencji wymagają dużych rezerw pamięci i czasu Wykład 5,

2 Programowanie dynamiczne Metody dynamiczne dobre są do zestawienia (porównania) dwóch sekwencji Jeśli celem jest znalezienie sekwencji homologicznych przeszukać trzeba bazę sekwencji. Przeszukać = porównać każdą sekwencję w bazie z zadaną sekwencją (query) to może być trudne.. Metody dynamiczne są raczej powolne i wymagają pamięci (na np. zapamiętanie macierzy F(nm) = O(nm)) Programowanie dynamiczne Rozmiar baz danych (rośnie ekspotencjalnie) białkowa: ok reszt aminokwasowych nukleotydowa: nukleotydów Czas pracy komputera z mocą obliczeniową 10 7 komórek macierzy/sekundę (pełne zestawienie metodami dynamicznymi) białko 300 aminokwasów: 25 godzin dla bazy białkowej DNA 1000 nukleotydów: 5555 godzin (323 dni) w GenBanku (wg. W. Makałowskiego) Wykład 5,

3 Algorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne (BLAST, FASTA) metody statystyczne (modele Markova, statystyka Bayesa) Rodzaje dopasowań pokrycie sekwencji globalne, lokalne liczba sekwencji porównywanych para (pairwise sequence alignment) więcej niż dwie (multiple sequences alignment) Macierze punktowe (DotPlot) Macierze DotPlot opierają się na ocenie wizualnej i czasami skuteczniejsze niż alignment wykrywają fragmenty powtarzające się, rearanżacje i podobieństawa lokalne Dotter: Wykład 5,

4 H I S S E Q E N C E H I S S E Q E N C E Bioinformatyka Dotter niektóre układy punktów tworzą ścieżkę każda ścieżka odpowiada jednemu dopasowaniu M Y S E Q U E N C E H I S S E Q E N C E M Y S E Q U E N C E H I S S E Q E N C E M Y S E Q U E N C E znaleźć najlepszą ścieżkę! Dotter niektóre układy punktów tworzą ścieżkę każda ścieżka odpowiada jednemu dopasowaniu M Y S E Q U E N C E H I S S E Q E N C E M Y S E Q U E N C E H I S S E Q E N C E M Y S E Q U E N C E znaleźć najlepszą ścieżkę! Wykład 5,

5 H I S S E Q E N C E H I S S E Q E N C E Bioinformatyka Dotter kropka w miejscu dopasowania układ kropek tworzy ścieżkę M Y S E Q U E N C E H I S S E Q E N C E M Y S E Q U E N C E H I S S E Q E N C E Czy wprowadzenie przerwy da lepsze dopasowanie? M Y S E Q U E N C E Dotter wprowadzenie przerwy wydłużenie ścieżki M Y S E Q U E N C E H I S S E Q E N C E M Y S E Q U E N C E H I S S E Q E N C E M Y S E Q U E N C E M Y S E Q U E N C E H I S S E Q - E N C E Wykład 5,

6 Najlepsza ścieżka? G A T T A C C G A T T C T A A Najlepsza ścieżka? G A T T A C C G A T T C T A A każda ścieżka odpowiada jakiemuś dopasowaniu która z nich jest optymalna? Wykład 5,

7 Najlepsza ścieżka Madryt Poznań optymalna? najszybsza? najkrótsza? Najlepsza ścieżka najlepsza ścieżka = Zestawienia sekwencji zależy od sposobu punktowania. tożsamości, podobieństwa, przerwy Wykład 5,

8 DotPlot -metody najprościej: kropka w miejscu identycznych znaków w sekwencjach lepiej: zastosowanie tablicy podobieństw (macierzy substytucji) kropka w miejscu, gdzie wartość podobieństwa przekracza określoną wartość lepiej: porównywanie okienek wstawianie kropek tam, gdzie ciąg n-liter ma punktację większą niż pewna wartość, albo jest określona liczba identycznych liter jeszcze lepiej: odfiltrowanie mniej istotnych kropek DotPlot najprostsza metoda W. Makałowski, 2005 Wykład 5,

9 DotPlot najprostsza metoda DotPlot metoda okienkowa obliczyć punktację w okienku o zadanym rozmiarze (window size) ocenić czy punktacja spełnia określone warunki (threshold) przesunąć okienko o zadany krok (step) Wykład 5,

10 DotPlot metoda okienkowa kropka= x brak kropki= o window size: 9 threshold: 6 step: 3 DotPlot metoda okienkowa window size: 9 threshold: 3 step: 6 Wykład 5,

11 DotPlot metoda okienkowa window size: 9 threshold: 3 step: 6 DotPlot metoda okienkowa window size: 9 threshold: 3 step: 6 Wykład 5,

12 DotPlot metoda okienkowa window size: 9 threshold: 3 step: 6 DotPlot- Dotter Dotter: Przykład: aktywator tkankowo plazminogenu urokinazowego (PLAU): P00749 aktywator tkankowo specyficznego plazminogenu (PLAT): P00750 (Bioinformatyka. Podręcznik do analizy genów i białek. A.D. Baxevanis, B.F.F. Quellette, PWN, 2005 ) Wykład 5,

13 rozmiar okna:16 BLOSUM62 pixel value = 34xscore/residue Wykład 5,

14 DotPlot- Dotter Dotter: Przykład: czynnik krzepnięcia XII (F12): P00748 aktywator tkankowo specyficznego plazminogenu (PLAT): P00750 (Bioinformatyka. Podręcznik do analizy genów i białek. A.D. Baxevanis, B.F.F. Quellette, PWN, 2005 ) Wykład 5,

15 Dotter - sekwencje Dotter - sekwencje Wykład 5,

16 Dotter SMART ( >gi gb AAH PLAT protein [Homo sapiens] >gi gb AAA coagulation factor XII FN1 fibrynonektyna typ I, powtarzalna jednostka FN2 fibrynonektyna typ II, powtarzalna jednostka EGF moduł nabłonkowego czynnika wzrostu KR domena typu kringle Tryp SPc domena katalityczna zapewniająca aktywność proteinazy serynowej Wykład 5,

17 aktywator tkankowo specyficznego plazminogenu aktywator tkankowo specyficznego plazminogenu czynnik krzepnięcia krwi czynnik krzepnięcia krwi Wykład 5,

18 aktywator tkankowo specyficznego plazminogenu czynnik krzepnięcia krwi Algorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne (BLAST, FASTA) metody statystyczne (modele Markova, statystyka Bayesa) Rodzaje dopasowań pokrycie sekwencji globalne, lokalne liczba sekwencji porównywanych para (pairwise sequence alignment) więcej niż dwie (multiple sequences alignment) Wykład 5,

19 Pokrycie sekwencji dopasowanie globalne dopasowanie wzdłuż całej sekwencji (zastosowanie: do białek składających się z pojedynczej domeny lub homologicznych słabo zróżnicowanych) dopasowanie lokalne uwzględnia domenową naturę białek, szuka subsekwencji (zastosowanie: do białek wielodomenowych, mrna z sekwencją genomową) Algorytm Smitha-Watermana dopasowanie lokalne ścieżka dopasowania nie musi osiągać krawędzi analizowanej sekwencji ścieżka jest lokalnie optymalna jeśli jej wydłużanie/skracanie nie poprawia obliczonej dla niej wartości system wartościowania dopasowania zaniża wartości w regionach słabego dopasowania = przerwanie ścieżki mogą istnieć ścieżki złożone z kilku połączonych ścieżek Smith, Waterman (1981) J.Mol.Biol. 147, Wykład 5,

20 Szukanie wielu dopasowań -subdopasowania Metoda optymalna daje zawsze najlepsze dopasowanie nawet jeśli nie ma ono znaczenia biologicznego znaczących, niezachodzących na siebie dopasowń lokalnych można naleźć kilka subdopasownia Trzeba szukać więcej niż jednego dopasowania! (lalign, SIM) Przykład: Czynnik krzepnięcia IX (F9, SWISS-PROT P00740) Czynnik krzepnięcia XII (F12, SWISS-PROT P00748) Dopasowanie optymalne i suboptymalne >sp P00740 FA9_HUMAN Coagulation factor IX precursor (EC ) (Christmas factor) (Plasma thromboplastin component) (PTC) [Contains: Coagulation factor IXa light chain; Coagulation factor IXa heavy chain] - Homo sapiens (Human). MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNL ERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCP FGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGR VSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPW QVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRII PHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVF HKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVE GTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT P00740 >sp P00748 FA12_HUMAN Coagulation factor XII precursor (EC ) (Hageman factor) (HAF) [Contains: Coagulation factor XIIa heavy chain; Betafactor XIIa part 1; Beta-factor XIIa part 2; Coagulation factor XIIa light chain] - Homo sapiens (Human). MRALLLLGFLLVSLESTLSIPPWEAPKEHKYKAEEHTVVLTVTGEPCHFPFQYHRQLYHK CTHKGRPGPQPWCATTPNFDQDQRWGYCLEPKKVKDHCSKHSPCQKGGTCVNMPSGPHCL CPQHLTGNHCQKEKCFEPQLLRFFHKNEIWYRTEQAAVARCQCKGPDAHCQRLASQACRT NPCLHGGRCLEVEGHRLCHCPVGYTGPFCDVDTKASCYDGRGLSYRGLARTTLSGAPCQP WASEATYRNVTAEQARNWGLGGHAFCRNPDNDIRPWCFVLNRDRLSWEYCDLAQCQTPTQ AAPPTPVSPRLHVPLMPAQPAPPKPQPTTRTPPQSQTPGALPAKREQPPSLTRNGPLSCG QRLRKSLSSMTRVVGGLVALRGAHPYIAALYWGHSFCAGSLIAPCWVLTAAHCLQDRPAP EDLTVVLGQERRNHSCEPCQTLAVRSYRLHEAFSPVSYQHDLALLRLQEDADGSCALLSP YVQPVCLPSGAARPSETTLCQVAGWGHQFEGAEEYASFLQEAQVPFLSLERCSAPDVHGS SILPGMLCAGFLEGGTDACQGDSGGPLVCEDQAAERRLTLQGIISWGSGCGDRNKPGVYT DVAYYLAWIREHTVS P00748 ExPasy Wykład 5,

21 Dopasowanie optymalne i suboptymalne lalign oraz dopasowania 2 i 3: Wykład 5,

22 SIM P00740 P00748 Algorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne (BLAST, FASTA) metody statystyczne (modele Markova, statystyka Bayesa) Rodzaje dopasowań pokrycie sekwencji globalne, lokalne liczba sekwencji porównywanych para (pairwise sequence alignment) więcej niż dwie (multiple sequences alignment) Wykład 5,

23 Metody heurystyczne Metody heurystyczne FASTA i BLAST Programowanie dynamiczne zapewnia najlepsze zestawienie, ale jest czasochłonne. Większość sekwencji w bazie danych nie jest homologiczna do sekwencji badanej. Znalezienie sposobu na ich odrzucenie przyspieszyło by obliczenia! Heurystyczny - pomocny w rozwiązaniu, służący odkryciu, ale nie gwarantujący rozwiązania. Wykład 5,

24 FASTA i BLAST wspólna strategia: szybkie przejrzenie bazy sekwencji wyeliminowanie sekwencji niepodobnych zestawienie (alignment) najlepszych FASTA i BLAST definicje: query sekwencje, która stanowi zapytanie do Bazy Danych subject sekwencja znaleziona w BD jako ta, która spełnia kryteria podobieństwa hit zestawienie lokalne miedzy query a subject Wykład 5,

25 sekwencja 2 (subject) Bioinformatyka FASTA website: ftp://ftp.virginia.edu/pub/fasta web-interface: Lipman DJ, Pearson WR. Rapid and sensitive protein similarity searches. Science.(1985)227(4693): Pearson WR, Lipman DJ. Improved tools for biological sequence comparison. Proc Natl Acad Sci U S A (1988)85(8): FASTA - pakiet oprogramowania do zestawień sekwencji DNA i białek FASTA program z dużą czułościa szukający podobieństwa między sekwencjami i z dużą prędkością fast = szybkie przybliżenie programowania dynamicznego FASTA format danych wprowadzony przez Pearsona FASTA Założenie: sekwencje podobne posiadają przekątne o wysokim podobieństwie sekwencja 1 (query) zestawienie zestawienie z przerwą Wykład 5,

26 FASTA Strategia: 4 etapy 1. znalezienie najlepszych regionów na przekątnych 2. powtórne sprawdzenie 10 najlepszych regionów przy użyciu macierzy PAM 3. połączenie wybranych regionów 4. obliczenie optymalnego zestawienia za pomocą programowania dynamicznego Ekstra. obliczenie istotności punktacji zestawienia FASTA- 4 etapy 1. znalezienie najlepszych regionów na przekątnych 2. powtórne sprawdzenie 10 najlepszych regionów przy użyciu macierzy PAM 3. wyeliminowanie regionów, które nie mogą być częcią zestawienia i połączenie wybranych regionów 4. obliczenie optymalnego zestawienia za pomocą programowania dynamicznego Wykład 5,

27 FASTA etap 1 znalezienie najlepszych regionów na przekątnej za pomocą tabel lookup table (lookup table lista wszystkich słów o zadanej długości ktup i ich pozycji w sekwencjach) M Y S E Q U E N C E N H I S S E Q E N C E Q CE EN EQ MY NC QV SE UE YS 9 7, itd. CE EN EQ HI IS NC QE SE SS 9 7 5, FASTA etap 1 znalezienie najlepszych regionów na przekątnej za pomocą tabel lookup table (lookup table lista wszystkich słów o zadanej długości ktup i ich pozycji w sekwencjach) M Y S E Q U E N C E N H I S S E Q E N C E Q CE 9 ktup=1 szukanie regionów z największą gęstością aa identycznych CE 9 EN 7,10 EN 7 EQ 4 ktup=2 szukanie regionów EQ o najwyższej 5,10 MY 1 gęstości identycznych HI par 1 NC 8 IS 2 QV 5 ktup z przedziału 1-6, rekomendowane NC SE 3 QE 6 UE 6 dla krótkich sekwencji (oligomerów) SE 4 ktup=1 YS 2 SS 3 Wykład 5,

28 HISSEQENCEQ MYSEQUENCEN FASTA etap 1 przekątna = pozycja subject - pozycja query słowo CE EN EQ NC SE Pozycja (subject) 9 7, Pozcja (query) 9 7 5, przekątna 0 0,+3-1, znalezienie regionów o największej gęstości MYSEQUENCEN HISSEQENCEQ region para należy do regionu? tak próba połączenia nie nowy region FASTA etap 2 dla każdego regionu obliczana jest punktacja - lokalne podobieństwo (punkty za identyczność, kary za zamianę) 10 najlepszych regionów przechodzi do etapu 2 ponowne obliczenie punktacji z macierzą PAM250 (lub BLOSUM50) lokalne podobieństwo bez przerw. dla każedego regionu znaleziona jest subsekwencja z maksymalną punktacja (init1) przycięcie regionu Wykład 5,

29 FASTA etap 3 łączenie przekątnych (próba łączenia przyciętych regionów zestawienie z przerwami) zwykle: 20 FASTA etap 4 tworzenie zestawienia całkowitego za pomocą lokalnego programowania dynamicznego (NWS Needleman-Wunch-Sellers) brane są pod uwagę tylko te elementy (aa, nt), które leżą w korytarzu o szerokości 32 elementy, wycentrowanym na najlepszym regionie init1 (z etapu 2) przypisanie punktacji ostatecznej (opt optimized score) Wykład 5,

30 FASTA etap 4/ekstra oszacowanie istotności porównania dla każdej sekwencji w bazie obliczany jest init1 - powstaje histogram z histogramu oblicza się średnią punktację podobieństwa query względem bazy, oraz odchylenie standardow rozkładu init1. Ostateczne zestawienie (NWS) wykonywane jest tylko dla sekwencji najlepszych w rankingu (wg. init1) FASTA - zastosowanie DNA-DNA białko-białko DNA-białko białko-dna przykład: ECGF1 (GI ) Wykład 5,

31 Wykład 5,

32 Wykład 5,

33 Wykład 5,

34 FASTA - Results Visual FASTA Wykład 5,

35 FASTA Alignments display FASTA - MView Wykład 5,

36 BLAST Basic Lolcal Alignment Search Tool BLAST oparty na wynikach statystycznego rozkładu punktacji lokalnych zestawień P(S>x) = 1- exp(-kmne -λx ) Zasada działania podobna do FASTA szybkie przeszukanie bazy, odrzucenie niepodobnych sekwencji, formalne zestawienie rozkład punktacji zestawień bez przerw (gaps) można wyliczyć zestawienia z przerwami tworzy się z szeregu zestawień bez przerw Wykład 5,

37 BLAST dla białek - BLASTp 1. podzielenie query na nakładające się słowa 2. określenie słów pokrewnych i przeszukanie bazy szukanie słów 3. wydłużenie zestawienia od słowa identycznego tworzenie MSP (matching segment pair), obliczenie istotności dla MSP 4. lokalne programowanie dynamiczne wokół MSP BLASTp etap 1 Query: TPQGQRQGQ.. podział na nakładające się słowa: TPQ PQG QGQ GQR QRQ RQG 1 2 3, Proces kontrolowany przez: w długość słowa T treshold minimalna punktacja jaką musi otrzymać słowo przy sparowaniu dopuszczone są nieidentyczność (niesparownie), punktacja na podstawie BLOSUM65 dla białek w=3 (najczęściej) do etapu 2 Wykład 5,

38 BLASTp etap 2 słowa pokrewne Query: TPQGQRQGQ.. TPQ PQG QGQ GQR QRQ RQG 1 2 3, tworzenie listy słów pokrewnych w oparciu o macierz BLOSUM62 AAA AAC AAD... PQG QGQ YYY AGA AGC AAN PEG QGM... AAG GAC AAE PRG MGQ... GAA AAQ PMG QAQ GAG QGN BLASTp etap 2 punktacja podobnych słów określona jest przez macierz BLOSUM62 PQG 18 PEG 15 PRG 14 PMG 14 PNG 13 PDG 13 PKG 12 etc. T Query: 325 LNKCKTPQGQRQGQQWIKQPLMDKN 350 L TP+GQR++++W+ P+ D Sbjct: 290 LDCTVTPMGQREAERWLHMPVRDTR 315 Wykład 5,

39 BLAST - etap 2 słowa rozpoczną rozszerzanie zestawienia BLAST zależność od wartości T T = 12 T = 14 T = 16 kompromis między czasem, czułościa i specyficznością Wykład 5,

40 Czułość,Specyficzność czułość = Prawdziwie pozytywne Prawdziwie pozytywne+fałszywie negatywne Prawdziwie pozytywne specyficzność = Prawdziwie pozytywne+fałszywie pozytywne niepodobne wszystkie znalezione podobne nieznalezione zbiór podobnych zbiór wszystkich sekwencji Wykład 5,

41 punktacja BLAST etap 3 wydłużanie sekwencji do wydłużenia potrzebne są dwa słowa na tej samej diagonalnej w odległości nie większej niż zadana wartość powstają HSP (high scoring pair) przybliżenie MSP kontrola przez x-dropoff value (jeśli punktacja zmniejszy się o x, wydłuzanie jest przerwane) tymaczasowa max punktacja max punktacja x = 5 długość zachowanego zestawienia Rodzaje BLASTów Wykład 5,

Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM Bioinformatyka (wykład monograficzny) wykład 5. E. Banachowicz Zakład Biofizyki Molekularnej IF UM http://www.amu.edu.pl/~ewas lgorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne

Bardziej szczegółowo

Bioinformatyka. Porównywanie sekwencji

Bioinformatyka. Porównywanie sekwencji Bioinformatyka Wykład 5 E. Banachowicz Zakład Biofizyki Molekularnej IF UM 1 http://www.amu.edu.pl/~ewas Porównywanie sekwencji Pierwsze pytanie biologa molekularnego, kiedy odkryje nową sekwencję: zy

Bardziej szczegółowo

Dopasowania par sekwencji DNA

Dopasowania par sekwencji DNA Dopasowania par sekwencji DNA Tworzenie uliniowień (dopasowań, tzw. alignmentów ) par sekwencji PSA Pairwise Sequence Alignment Dopasowania globalne i lokalne ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA

Bardziej szczegółowo

PRZYRÓWNANIE SEKWENCJI

PRZYRÓWNANIE SEKWENCJI http://theta.edu.pl/ Podstawy Bioinformatyki III PRZYRÓWNANIE SEKWENCJI 1 Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych), które posiadają

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów

Bardziej szczegółowo

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Przyrównanie sekwencji Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych),

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów

Bardziej szczegółowo

Porównywanie sekwencji białkowych

Porównywanie sekwencji białkowych Bioinformatyka -9 Bioinformatyka Wykład 4. E. Banachowicz Zakład Biofizyki Molekularnej http://www.amu.edu.pl/~ewas Porównywanie sekwencji białkowych Wykład 4, Bioinformatyka -9 Porównywanie sekwencji

Bardziej szczegółowo

Porównywanie i dopasowywanie sekwencji

Porównywanie i dopasowywanie sekwencji Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek pojawiła się nowa możliwość śledzenia ewolucji na poziomie molekularnym Ewolucja

Bardziej szczegółowo

Porównywanie i dopasowywanie sekwencji

Porównywanie i dopasowywanie sekwencji Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek narodziła się nowa dyscyplina nauki ewolucja molekularna Ewolucja molekularna

Bardziej szczegółowo

Wykład 5 Dopasowywanie lokalne

Wykład 5 Dopasowywanie lokalne Wykład 5 Dopasowywanie lokalne Dopasowanie par (sekwencji) Dopasowanie globalne C A T W A L K C A T W A L K C O W A R D C X X O X W X A X R X D X Globalne dopasowanie Schemat punktowania (uproszczony)

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Wyszukiwanie sekwencji Jak wyszukad z baz danych bioinformatycznych sekwencje podobne do sekwencji zadanej (ang. query

Bardziej szczegółowo

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010)

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010) Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie

Bardziej szczegółowo

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012)

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012) Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie

Bardziej szczegółowo

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment Dopasowywanie sekwencji Sequence alignment Drzewo filogenetyczne Kserokopiarka zadanie: skopiować 300 stron. Co może pójść źle? 2x ta sama strona Opuszczona strona Nadmiarowa pusta strona Strona do góry

Bardziej szczegółowo

Dopasowanie sekwencji (sequence alignment)

Dopasowanie sekwencji (sequence alignment) Co to jest alignment? Dopasowanie sekwencji (sequence alignment) Alignment jest sposobem dopasowania struktur pierwszorzędowych DNA, RNA lub białek do zidentyfikowanych regionów w celu określenia podobieństwa;

Bardziej szczegółowo

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania Wprowadzenie do Informatyki Biomedycznej Wykład 2: Metody dopasowywania sekwencji Wydział Informatyki PB Dopasowywanie sekwencji (ang. sequence alignment) Dopasowywanie (przyrównywanie) sekwencji polega

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych...

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych... Przedmowa... XI Część pierwsza Wprowadzenie i biologiczne bazy danych 1 Wprowadzenie... 3 Czym jest bioinformatyka?... 5 Cele... 5 Zakres zainteresowań... 6 Zastosowania... 7 Ograniczenia... 8 Przyszłe

Bardziej szczegółowo

Przyrównywanie sekwencji

Przyrównywanie sekwencji Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański Przyrównywanie sekwencji 1. Porównywanie sekwencji wprowadzenie Sekwencje porównujemy po to, aby

Bardziej szczegółowo

Dopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl

Dopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl Dopasowanie sekwencji c.d. Sequence alignment Bioinformatyka, wykład 5 (6.XI.2012) krzysztof_pawlowski@sggw.pl Dopasowanie sekwencji - znaczenie Podobieństwo porównywanych sekwencji (similarity) może świadczyć

Bardziej szczegółowo

Dopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl

Dopasowanie sekwencji c.d. Sequence alignment. Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl Dopasowanie sekwencji c.d. Sequence alignment Bioinformatyka, wykład 5 (16.XI.2010) krzysztof_pawlowski@sggw.pl dopasowanie - metody dopasowanie par sekwencji: Macierz punktów - dot matrix, dotplot Programowanie

Bardziej szczegółowo

Spis treści 8 Ewolucja molekularna... 87. 9 Ewolucyjne podstawy porównywania sekwencji... 87. 9.1 Identyfikacja sekwencji i jej funkcji...

Spis treści 8 Ewolucja molekularna... 87. 9 Ewolucyjne podstawy porównywania sekwencji... 87. 9.1 Identyfikacja sekwencji i jej funkcji... Spis treści 8 Ewolucja molekularna... 87 9 Ewolucyjne podstawy porównywania sekwencji... 87 9.1 Identyfikacja sekwencji i jej funkcji... 87 9.2 Homologia... 88 9.3 Modele ewolucji sekwencji białkowej...

Bardziej szczegółowo

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji. Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie

Bardziej szczegółowo

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji Bioinformatyka wykład 5: dopasowanie sekwencji prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie podobieństwa sekwencji stanowi podstawę wielu gałęzi

Bardziej szczegółowo

Wykład 10 2008-04-30. Bioinformatyka. Wykład 9. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

Wykład 10 2008-04-30. Bioinformatyka. Wykład 9. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM Bioinformatyka Wykład 9 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Konsekwencje zestawieo wielu sekwencji - rodziny białkowe, domeny, motywy i wzorce 2 Bioinformatyka,

Bardziej szczegółowo

Generator testów 1.3.1 Bioinformatyka_zdalne wer. 1.0.13 / 0 Strona: 1

Generator testów 1.3.1 Bioinformatyka_zdalne wer. 1.0.13 / 0 Strona: 1 Przedmiot: Bioinformatyka Nazwa testu: Bioinformatyka_zdalne wer. 1.0.13 Nr testu 0 Klasa: WNB UZ Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Model Markowa substytucji aminokwasów w mutagenezie białek zakłada...

Bardziej szczegółowo

3 Przeszukiwanie baz danych

3 Przeszukiwanie baz danych Spis treści 3 Przeszukiwanie baz danych 1 3.1 Heurystyczne algorytmy...................... 1 3.1.1 FASTA........................... 1 3.1.2 BLAST........................... 3 3.2 Macierze substytucyjne.......................

Bardziej szczegółowo

Generator testów Bioinformatyka wer / 0 Strona: 1

Generator testów Bioinformatyka wer / 0 Strona: 1 Przedmiot: Nazwa przedmiotu Nazwa testu: Bioinformatyka wer. 1.0.6 Nr testu 0 Klasa: V zaoczne WNB UZ Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Analiza porównawcza białek zwykle zaczyna się na badaniach

Bardziej szczegółowo

Dopasowanie par sekwencji

Dopasowanie par sekwencji BIOINFORMTYK edycja 2016 / 2017 wykład 3 Dopasowanie par sekwencji dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Idea i cele dopasowania sekwencji 2. Definicje

Bardziej szczegółowo

Statystyczna analiza danych

Statystyczna analiza danych Statystyczna analiza danych ukryte modele Markowa, zastosowania Anna Gambin Instytut Informatyki Uniwersytet Warszawski plan na dziś Ukryte modele Markowa w praktyce modelowania rodzin białek multiuliniowienia

Bardziej szczegółowo

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST. Ćwiczenie 5/6 Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST. Prof. dr hab. Roman Zieliński 1. Informacja genetyczna u

Bardziej szczegółowo

dopasowanie sekwencji Porównywanie sekwencji Etapy dopasowywania sekwencji Homologia, podobieństwo i analogia

dopasowanie sekwencji Porównywanie sekwencji Etapy dopasowywania sekwencji Homologia, podobieństwo i analogia Porównywanie sekwencji Homologia, podobieństwo i analogia dopasowanie sekwencji Dopasowanie/porównywanie Uliniowienie Alignment W bioinformatyce, dopasowanie sekwencji jest sposobem dopasowania struktur

Bardziej szczegółowo

Bioinformatyka wykład 8, 27.XI.2012

Bioinformatyka wykład 8, 27.XI.2012 Bioinformatyka wykład 8, 27.XI.2012 białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 2013-01-21 1 Plan wykładu regiony nieuporządkowane sposoby przedstawienia struktur białkowych powierzchnia

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW DOPASOWYWANIE SEKWENCJI 1. Miary podobieństwa sekwencji aminokwasów 2. Zastosowanie programów: CLUSTAL OMEGA BLAST Copyright 2013, Joanna Szyda

Bardziej szczegółowo

Bioinformatyka 2 (BT172) Struktura i organizacja kursu

Bioinformatyka 2 (BT172) Struktura i organizacja kursu Bioinformatyka 2 (BT172) Wykład 1 Struktura i organizacja kursu dr Krzysztof Murzyn adiunkt w Zakładzie Biofizyki WBtUJ pok. B028, tel. 664-6379 10.X.2005 PODSTAWOWE INFORMACJE 9 godz. wykładów (45 min,

Bardziej szczegółowo

Motywy i podobieństwo

Motywy i podobieństwo Motywy i podobieństwo Całość funkcja Modularna budowa białek Elementy składowe czyli miejsca wiązania, domeny 1 Motywy Motyw jest opisem określonej części trójwymiarowej struktury zawierającym charakterystyczny

Bardziej szczegółowo

Bioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee

Bioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee Bioinformatyka 2 (BT172) Wykład 5 Progresywne metody wyznaczania MSA: T-coffee Krzysztof Murzyn 14.XI.2005 PLAN WYKŁADU Ostatnio : definicje, zastosowania MSA, złożoność obliczeniowa algorytmu wyznaczania

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa 4. Etapy konstrukcji drzewa filogenetycznego

Bardziej szczegółowo

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Konstruowanie drzew filogenetycznych Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Drzewa filogenetyczne ukorzenione i nieukorzenione binarność konstrukcji topologia (sposób rozgałęziana

Bardziej szczegółowo

MultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński

MultiSETTER: web server for multiple RNA structure comparison. Sandra Sobierajska Uniwersytet Jagielloński MultiSETTER: web server for multiple RNA structure comparison Sandra Sobierajska Uniwersytet Jagielloński Wprowadzenie Budowa RNA: - struktura pierwszorzędowa sekwencja nukleotydów w łańcuchu: A, U, G,

Bardziej szczegółowo

Algorytmy kombinatoryczne w bioinformatyce

Algorytmy kombinatoryczne w bioinformatyce lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie

Bardziej szczegółowo

Ocena jakości modeli strukturalnych białek w oparciu o podobieństwo strukturalne i semantyczny opis funkcji w ontologii GO

Ocena jakości modeli strukturalnych białek w oparciu o podobieństwo strukturalne i semantyczny opis funkcji w ontologii GO Ocena jakości modeli strukturalnych białek w oparciu o podobieństwo strukturalne i semantyczny opis funkcji w ontologii GO Bogumil Konopka 1, Jean-Christophe Nebel 2, Malgorzata Kotulska 1 * 1 Politechnika

Bardziej szczegółowo

Bioinformatyka wykład 10

Bioinformatyka wykład 10 Bioinformatyka wykład 10 21.XII.2010 białkowa bioinformatyka strukturalna, c.d. krzysztof_pawlowski@sggw.pl 2011-01-17 1 Regiony nieuporządkowane disordered regions trudna definicja trudne do przewidzenia

Bardziej szczegółowo

Wyszukiwanie podobnych sekwencji w bazach danych. Wyszukiwanie w sekwencji nukleotydów czy aminokwasów? Czułość i selektywność

Wyszukiwanie podobnych sekwencji w bazach danych. Wyszukiwanie w sekwencji nukleotydów czy aminokwasów? Czułość i selektywność Wersja 1.05 Wprowadzenie do Informatyki Biomedycznej Wykład 3: Wyszukiwanie w bazach sekwencji Przewidywanie genów Wydział Informatyki PB Marek Krętowski pokój 206 e-mail: m.kretowski@pb.edu.pl http://aragorn.pb.bialystok.pl/~mkret

Bardziej szczegółowo

Algorytmy kombinatoryczne w bioinformatyce

Algorytmy kombinatoryczne w bioinformatyce lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Często dopasować chcemy nie dwie sekwencje ale kilkanaście lub więcej 2 Istnieją dokładne algorytmy, lecz są one niewydajne

Bardziej szczegółowo

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański BIOINFORMATYKA edycja 2016 / 2017 wykład 11 RNA dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Rola i rodzaje RNA 2. Oddziaływania wewnątrzcząsteczkowe i struktury

Bardziej szczegółowo

BIOLOGICZNE BAZY DANYCH SYLABUS

BIOLOGICZNE BAZY DANYCH SYLABUS BIOLOGICZNE BAZY DANYCH SYLABUS Elementy składowe sylabusu Nazwa jednostki prowadzącej kierunek Nazwa kierunku studiów Poziom kształcenia Profil studiów Forma studiów Kod Język Rodzaj Rok studiów /semestr

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA

PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa - przykłady 4. Etapy konstrukcji drzewa

Bardziej szczegółowo

Ćwiczenia nr 5. Wykorzystanie baz danych i narzędzi analitycznych dostępnych online

Ćwiczenia nr 5. Wykorzystanie baz danych i narzędzi analitycznych dostępnych online Techniki molekularne ćw. 5 1 z 13 Ćwiczenia nr 5. Wykorzystanie baz danych i narzędzi analitycznych dostępnych online I. Zasoby NCBI Strona: http://www.ncbi.nlm.nih.gov/ stanowi punkt startowy dla eksploracji

Bardziej szczegółowo

Bioinformatyka wykład 3.I.2008

Bioinformatyka wykład 3.I.2008 Bioinformatyka wykład 3.I.2008 Białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 2008-01-03 1 Plan wykładu analiza i porównywanie struktur białek. doświadczalne metody badania struktur

Bardziej szczegółowo

Wstęp do programowania

Wstęp do programowania Wstęp do programowania Algorytmy zachłanne, algoritme Dijkstry Paweł Daniluk Wydział Fizyki Jesień 2013 P. Daniluk(Wydział Fizyki) WP w. XI Jesień 2013 1 / 25 Algorytmy zachłanne Strategia polegająca na

Bardziej szczegółowo

Bioinformatyczne bazy danych

Bioinformatyczne bazy danych Bioinformatyczne bazy danych Czym jest bioinformatyka? Bioinformatyka jest nauką integrującą różne dziedziny wiedzy Gruca (2010) Czym jest bioinformatyka? Bioinformatyka obejmuje technologie wykorzystujące

Bardziej szczegółowo

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Wykład 7 Etapy analizy NGS Dr Wioleta Drobik-Czwarno Etapy analizy NGS Kontrola jakości surowych danych (format fastq) Jakość odczytów,

Bardziej szczegółowo

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka Słowo wstępne XIII Przedmowa XV 1. Bioinformatyka i Internet Andreas D. Baxevanis 1 1.1. Podstawy Internetu 2 1.2. Połączenie z Internetem

Bardziej szczegółowo

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny

Bardziej szczegółowo

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Wykład 7 Etapy analizy NGS Dr Wioleta Drobik-Czwarno Etapy analizy NGS Kontrola jakości surowych danych (format fastq) Jakość odczytów,

Bardziej szczegółowo

D: Dopasowanie sekwencji. Programowanie dynamiczne

D: Dopasowanie sekwencji. Programowanie dynamiczne D: Dopasowanie sekwencji. Programowanie dynamiczne Problem: jak porównywać sekwencje DNA? Czy te sekwencje są podobne? Jeśli są podobne, to jak mierzyć to podobieństwo? Odpowiedzi są kluczowe dla konstrukcji

Bardziej szczegółowo

Bioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d.

Bioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d. Bioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 11.01.11 1 Dopasowanie strukturalne (alignment) odległość: d ij = (x i -x J ) 2 + (y i -y J ) 2

Bardziej szczegółowo

BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH

BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH http://theta.edu.pl/ Podstawy Bioinformatyki II BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH 1 Czym jest bioinformatyka? 2 Bioinformatyka Bioinformatyka jest interdyscyplinarną dziedziną nauki obejmującą wykorzystanie

Bardziej szczegółowo

Bioinformatyka: Wykład 2. Algorytm Smitha Watermana implementacja w języku Python

Bioinformatyka: Wykład 2. Algorytm Smitha Watermana implementacja w języku Python Bioinformatyka: Wykład 2 Algorytm Smitha Watermana implementacja w języku Python Przyrównanie sekwencji Algorytm Smitha-Watermana dla pary sekwencji P i Q o długościach odpowiednio M i N. Zbuduj macierz

Bardziej szczegółowo

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI Podstawy Bioinformatyki lab 1 PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 1 BIOINFORMATYKA Dr Magda Mielczarek Katedra Genetyki, pokój nr 14 ul. Kożuchowska

Bardziej szczegółowo

W kierunku równoległej implementacji pakietu T-Coffee

W kierunku równoległej implementacji pakietu T-Coffee W kierunku równoległej implementacji pakietu T-Coffee Adrian Rospondek 1 1 Wydział Inżynierii Mechanicznej i Informatyki Kierunek Informatyka, Rok V a.rospondek@poczta.fm Streszczenie Artykuł ten prezentuje

Bardziej szczegółowo

Bioinformatyczne bazy danych

Bioinformatyczne bazy danych Bioinformatyczne bazy danych Czym jest bioinformatyka? Bioinformatyka jest nauką integrującą różne dziedziny wiedzy Gruca (2010) http://bioinformaticsonline.com/file/view/4482/bioinformatics-definitions-and-applications

Bardziej szczegółowo

Wstęp do programowania

Wstęp do programowania Wstęp do programowania Algorytmy zachłanne, programowanie dynamiczne Paweł Daniluk Wydział Fizyki Jesień 2014 P. Daniluk(Wydział Fizyki) WP w. IX Jesień 2014 1 / 26 Algorytmy zachłanne Strategia polegająca

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

Definicja pliku kratowego

Definicja pliku kratowego Pliki kratowe Definicja pliku kratowego Plik kratowy (ang grid file) jest strukturą wspierająca realizację zapytań wielowymiarowych Uporządkowanie rekordów, zawierających dane wielowymiarowe w pliku kratowym,

Bardziej szczegółowo

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski Genomika Porównawcza Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski 1 Plan prezentacji 1. Rodzaje i budowa drzew filogenetycznych 2. Metody ukorzeniania drzewa

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova M. Czoków, J. Piersa 2010-12-21 1 Definicja Własności Losowanie z rozkładu dyskretnego 2 3 Łańcuch Markova Definicja Własności Losowanie z rozkładu

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecność Literatura, materiały Bioinformatyka i ewolucja

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa M. Czoków, J. Piersa 2012-01-10 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego 3 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego

Bardziej szczegółowo

Generator testów bioinformatyka wer / Strona: 1

Generator testów bioinformatyka wer / Strona: 1 Przedmiot: wyklad monograficzny Nazwa testu: bioinformatyka wer. 1.0.6 Nr testu 10469906 Klasa: 5 IBOS Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Aminokwas jest to związek organiczny zawierający A) grupę

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

Bioinformatyka. Program UGENE

Bioinformatyka. Program UGENE Bioinformatyka Program UGENE www.michalbereta.pl UGENE jest darmowym programem do zadań bioinformatycznych. Można go pobrać ze strony http://ugene.net/. 1 1. Wczytanie rekordu z bazy ENA do programu UGENE

Bardziej szczegółowo

Wybrane podstawowe rodzaje algorytmów

Wybrane podstawowe rodzaje algorytmów Wybrane podstawowe rodzaje algorytmów Tomasz Głowacki tglowacki@cs.put.poznan.pl Zajęcia finansowane z projektu "Rozwój i doskonalenie kształcenia na Politechnice Poznańskiej w zakresie technologii informatycznych

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: przedmiot obowiązkowy w ramach treści kierunkowych, moduł kierunkowy ogólny Rodzaj zajęć: wykład, ćwiczenia I KARTA PRZEDMIOTU CEL PRZEDMIOTU

Bardziej szczegółowo

Metody bioinformatyki (MBI) projekt, dokumentacja końcowa

Metody bioinformatyki (MBI) projekt, dokumentacja końcowa Metody bioinformatyki (MBI) projekt, dokumentacja końcowa Michał Kielak, Konrad Miziński 16 czerwca 2014 1 Temat projektu Badanie podobieństwa dwóch sekwencji - algorytm Smitha-Watermana z afiniczna funkcja

Bardziej szczegółowo

BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE. Podstawy Bioinformatyki wykład 4

BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE. Podstawy Bioinformatyki wykład 4 BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE Podstawy Bioinformatyki wykład 4 GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 2 GENOMY I ICH ADNOTACJE

Bardziej szczegółowo

- - Ocena wykonaniu zad3. Brak zad3

- - Ocena wykonaniu zad3. Brak zad3 Indeks Zad1 Zad2 Zad3 Zad4 Zad Ocena 20986 218129 ocena 4 Zadanie składa się z Cw3_2_a oraz Cw3_2_b Brak opcjonalnego wywołania operacji na tablicy. Brak pętli Ocena 2 Brak zad3 Ocena wykonaniu zad3 po

Bardziej szczegółowo

Algorytmy przeszukiwania wzorca

Algorytmy przeszukiwania wzorca Algorytmy i struktury danych Instytut Sterowania i Systemów Informatycznych Wydział Elektrotechniki, Informatyki i Telekomunikacji Uniwersytet Zielonogórski Algorytmy przeszukiwania wzorca 1 Wstęp Algorytmy

Bardziej szczegółowo

Bioinformatyka Bioinformatyka. Wykład 6. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

Bioinformatyka Bioinformatyka. Wykład 6. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM Bioinformatyka Wykład 6 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Algorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne (BLAST, FASTA)

Bardziej szczegółowo

Wykład Bioinformatyka 2012-09-24. Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

Wykład Bioinformatyka 2012-09-24. Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki Bioinformatyka Wykład 7 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Plan Bioinformatyka Ewolucyjne podstawy Bioinformatyki Filogenetyka Bioinformatyczne narzędzia

Bardziej szczegółowo

WIZUALIZACJA ALGORYTMÓW OPTYMALNEGO DOPASOWANIA SEKWENCJI NUKLEOTYDÓW I AMINOKWASÓW

WIZUALIZACJA ALGORYTMÓW OPTYMALNEGO DOPASOWANIA SEKWENCJI NUKLEOTYDÓW I AMINOKWASÓW STUDIA INFORMATICA 2011 Volume 32 Number 2A (96) Adam SKOWRON, Dariusz MROZEK Politechnika Śląska, Instytut Informatyki WIZUALIZACJA ALGORYTMÓW OPTYMALNEGO DOPASOWANIA SEKWENCJI NUKLEOTYDÓW I AMINOKWASÓW

Bardziej szczegółowo

Wstęp do Biologii Obliczeniowej

Wstęp do Biologii Obliczeniowej Wstęp do Biologii Obliczeniowej Zagadnienia na kolokwium Bartek Wilczyński 5. czerwca 2018 Sekwencje DNA i grafy Sekwencje w biologii, DNA, RNA, białka, alfabety, transkrypcja DNA RNA, translacja RNA białko,

Bardziej szczegółowo

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ Joanna Bryndza Wprowadzenie Jednym z kluczowych problemów w szacowaniu poziomu ryzyka przedsięwzięcia informatycznego

Bardziej szczegółowo

Homologia, podobieństwo i analogia

Homologia, podobieństwo i analogia Porównywanie sekwencji Homologia, podobieństwo i analogia Homologi Ortologi homologiczne geny, których rozdzielenie nastąpiło na skutek specjacji, czyli rozdzielenia gatunków, lub rzadziej horyzontalnego

Bardziej szczegółowo

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka Wstęp do obsługi biologicznych baz danych i analizy porównawczej białek i genów Katedra Fizjologii i Biotechnologii Roślin Pok. 113 CB jan.jastrzebski@uwm.edu.pl bioinformatyka@gmail.com www.ebiology.net

Bardziej szczegółowo

Kasy Fiskalne Lublin Analityk

Kasy Fiskalne Lublin Analityk Kasy Fiskalne Lublin Analityk http://sklep.soft-tec.lublin.pl/produkt/analityk Producent Cena Cena netto Insert 984.00 PLN 800.00 PLN Analityk to system wspomagania decyzji, który opiera się na najnowszych

Bardziej szczegółowo

BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE

BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE Podstawy Bioinformatyki wykład 2 PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 1 GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC PODSTAWY BIOINFORMATYKI

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Filogenetyka molekularna wykorzystuje informację zawartą w sekwencjach aminokwasów lub nukleotydów do kontrukcji drzew

Bardziej szczegółowo

PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE

PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE D: PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE I. Strategia zachłanna II. Problem przetasowań w genomie III. Sortowanie przez odwrócenia IV. Algorytmy przybliżone V. Algorytm zachłanny

Bardziej szczegółowo

Metody Programowania

Metody Programowania POLITECHNIKA KRAKOWSKA - WIEiK KATEDRA AUTOMATYKI i TECHNIK INFORMACYJNYCH Metody Programowania www.pk.edu.pl/~zk/mp_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład 8: Wyszukiwanie

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

TRANSKRYPCJA - I etap ekspresji genów

TRANSKRYPCJA - I etap ekspresji genów Eksparesja genów TRANSKRYPCJA - I etap ekspresji genów Przepisywanie informacji genetycznej z makrocząsteczki DNA na mniejsze i bardziej funkcjonalne cząsteczki pre-mrna Polimeraza RNA ETAP I Inicjacja

Bardziej szczegółowo

Języki skryptowe w programie Plans

Języki skryptowe w programie Plans Języki skryptowe w programie Plans Warsztaty uŝytkowników programu PLANS Kościelisko 2010 Zalety skryptów Automatyzacja powtarzających się czynności Rozszerzenie moŝliwości programu Budowa własnych algorytmów

Bardziej szczegółowo

Bioinformatyka. Rodzaje Mutacji

Bioinformatyka. Rodzaje Mutacji Bioinformatyka (wykład monograficzny) wykład 3. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas Rodzaje Mutacji zmienność sekwencji (sequence variation) mutacje polimorfizm

Bardziej szczegółowo

Metody numeryczne. materiały do wykładu dla studentów

Metody numeryczne. materiały do wykładu dla studentów Metody numeryczne materiały do wykładu dla studentów 4. Wartości własne i wektory własne 4.1. Podstawowe definicje, własności i twierdzenia 4.2. Lokalizacja wartości własnych 4.3. Metoda potęgowa znajdowania

Bardziej szczegółowo

Bioinformatyka wykład 9

Bioinformatyka wykład 9 Bioinformatyka wykład 9 14.XII.21 białkowa bioinformatyka strukturalna krzysztof_pawlowski@sggw.pl 211-1-17 1 Plan wykładu struktury białek dlaczego? struktury białek geometria i fizyka modyfikacje kowalencyjne

Bardziej szczegółowo

Mapowanie sekwencji na genom (Ultrafast and memory-efficient alignment of short DNA sequences to the human gemone)

Mapowanie sekwencji na genom (Ultrafast and memory-efficient alignment of short DNA sequences to the human gemone) Mapowanie sekwencji na genom (Ultrafast and memory-efficient alignment of short DNA sequences to the human gemone) Uniwersytet Warszawski 1 kwietnia 2010 Referowana praca Problem Problem Wstęp Referowana

Bardziej szczegółowo

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa

Bardziej szczegółowo