Dopasowanie par sekwencji

Wielkość: px
Rozpocząć pokaz od strony:

Download "Dopasowanie par sekwencji"

Transkrypt

1 BIOINFORMTYK edycja 2016 / 2017 wykład 3 Dopasowanie par sekwencji dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl

2 Plan wykładu 1. Idea i cele dopasowania sekwencji 2. Definicje 3. Macierze kropkowe (dot-plot) 4. Podobieństwo a identyczność 5. lgorytm Needlemana-Wunscha - model liniowy 6. Znaczenie kary za otwarcie przerwy - model afiniczny 7. lgorytm o liniowej złożoności pamięciowej slajd 2

3 Idea i cele dopasowania sekwencji slajd 3

4 Cel porównywania sekwencji Określenie stopnia podobieństwa między sekwencjami. Podobieństwo to mierzymy jednak nie miarą stosowaną przy porównywaniu zwykłych danych tekstowych. Interesuje nas podobieństwo ewolucyjne. Miarą podobieństwa sekwencji (nukleotydowych, aminokwasowych) będzie zatem miara związana z prawdopodobieństwem i ilością mutacji niezbędnych do przeprowadzenia jednej sekwencji w drugą. slajd 4

5 Wnioski z porównywania sekwencji Pierwsze pytanie biologa molekularnego, kiedy odkryje nową sekwencję: Czy w bazie sekwencji są już sekwencje podobne do mojej? - sekwencje są identyczne nic nowego - sekwencja jest podobna (ma krewnych ) nowy członek znanej rodziny - sekwencja ma kilka podobnych regionów, motywów lub domen można zaproponować funkcję - nie ma znaczącego podobieństwa dużo pracy slajd 5

6 Podstawy ewolucyjne Mutacje: substytucja α = tranzycja ( G, C T) β = transwersja (pozostałe) insercja delecja Białka homologiczne (spokrewnione ewolucyjnie) mają podobne sekwencje. slajd 6

7 Homologia a podobieństwo sekwencji Podobieństwo miara ilościowa Homologia określenie jakościowe wnioskowanie o pokrewieństwie sekwencji na podstawie stopnia ich podobieństwa Pytanie: Jaki stopień podobieństwa decyduje o homologii? I w drugą stronę: Jakie jest prawdopodobieństwo, że dwie przypadkowe sekwencje będą identyczne? slajd 7

8 Dopasowanie globalne i lokalne dopasowanie globalne dopasowanie wzdłuż całej sekwencji (np. analiza białek składających się z pojedynczej domeny lub białek homologicznych, słabo zróżnicowanych; stosujemy dla sekwencji stosunkowo krótkich np. pojedyncze geny o zbliżonej długości) dopasowanie lokalne poszukiwanie lokalnych regionów o dużym stopniu podobieństwa (np. analiza białek wielodomenowych, poszukiwanie motywów stosujemy dla sekwencji istotnie różniących się długością (np. poszukiwanie krótkich motywów w całym genomie); często odległych ewolucyjnie) slajd 8

9 Definicje slajd 9

10 Oznaczenia Rozważmy sekwencję S o długości l nad alfabetem Σ Oznaczmy: S[i..j] - podciąg S zaczynający się na pozycji i i kończący się na pozycji j ( S = S[0,l-1] ) S[i] - symbol z S na pozycji i S - długość sekwencji S ( S=l ) ε - pusta sekwencja (sekwencja o długości 0) - symbol przerwy ( - Σ ) slajd 10

11 lfabet Dla analizy sekwencji DN Σ = {, C, G, T} Dla analizy sekwencji RN Σ = {, C, G, U} Dla analizy sekwencji aminokwasów Σ = {, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, Y} W zależności od potrzeb można też używać innych, rozszerzonych alfabetów. slajd 11

12 Rozszerzone alfabety dla kwasów nukleinowych DN RN = adenina C = cytozyna G = guanina T = tymina R = G (zasada purynowa) Y = T C (zasada pyrimidinowa) K = G T (keto) M = C (amino) S = G C (silne wiązania) W = T (słabe wiązania) B = G T C (dowolny, lecz nie ) D = G T (dowolny, lecz nie C) H = C T (dowolny, lecz nie G) V = G C (dowolny, lecz nie T) N = G C T (dowolny) = adenina C = cytozyna G = guanina U = uracyl R = G (zasada purynowa) Y = U C (zasada pyrimidinowa) K = G U (keto) M = C (amino) S = G C (silne wiązania) W = U (słabe wiązania) B = G U C (dowolny, lecz nie ) D = G U (dowolny, lecz nie C) H = C U (dowolny, lecz nie G) V = G C (dowolny, lecz nie U) N = G C U (dowolny) slajd 12

13 Rozszeszony alfabet dla białek slajd 13

14 Dopasowanie globalne Definicja: Niech S0, S1 sekwencje nad alfabetem Σ o długościach odpowiednio l0 i l1. Globalnym dopasowaniem pary sekwencji (global pairwise sequence alignment) nazywamy macierz M o wymiarach 2 n, gdzie n max{l0,l1} taką, że 0 k 1, 0 i n-1: M[k][i] = - lub M[k][i] = Sk[p], p {0,...,lk 1} M[k][i] = - M[1-k][i] i<j ( M[k][i] = Sk[p] i M[k][j] = Sk[q] p<q ) 0 p lk-1 j {0,...,n 1} : M[k][j] = Sk[p] Przykład: S0 = TGCTG S1 = CGTTG T - G C T - G - C G - - T T G T G C T - G C G - - T T G slajd 14

15 Dopasowanie - przykład S1 = TTG S2 = TGG Podaj przykłady dopasowania. Zwykle jesteśmy w stanie zaproponować wiele różnych dopasowań. Które dopasowanie jest optymalne? Czy możemy to określić jednoznacznie? Będziemy szukali dopasowania najlepszego, tj. takiego, które minimalizuje skojarzoną z tym dopasowaniem funkcję kary. slajd 15

16 Macierze kropkowe slajd 16

17 Idea metody dot plot: tworzenie macierzy Miejsca zgodności nukleotydów (aminokwasów) zaznaczamy kropkami. slajd 17

18 Idea metody dot plot: tworzenie macierzy (2) Dopasowanie tam, gdzie kropki tworzą linię ciągłą na przekątnej. slajd 18

19 Przykład: porównanie dwóch spokrewnionych genów slajd 19

20 Przykład duża liczba powtórzeń Jak będzie wyglądała macierz kropkowa dla pary sekwencji z dużą liczbą powtarzających się fragmentów? slajd 20

21 Wady macierzy kropkowych - Szum (pewnym rozwiązaniem problemu może tu być metoda okna) - Brak możliwości jakościowej oceny dopasowania slajd 21

22 Macierze kropkowe metoda okna Idea: zaznaczanie punktu tylko jeżeli identyczność występuje dla całego podciągu sekwencji o określonej długości (parametr nazywany wielkością okna) rozmiar okna: 1 rozmiar okna: 9 slajd 22

23 Metoda okna przykład (1) C C Sequence 2 T G G G G T C C Sequence 1 Jak wypełnimy macierz? a) okno wielkości 1 b) okno wielkości 3 slajd 23

24 Metoda okna przykład (2) a) rozmiar okna: 1 zgodność C C Sequence 2 T G G G G T C C Sequence 1 slajd 24

25 Metoda okna przykład (3) b) rozmiar okna: 3 C obszary brzegowe pomijamy C Sequence 2 T G G G G T C C Sequence 1 slajd 25

26 Metoda okna przykład (4) b) rozmiar okna: 3 C C GG GG Sequence 2 T = 3 / 3 zgodność G G G G T C C Sequence 1 slajd 26

27 Metoda okna przykład (5) b) rozmiar okna: 3 C C GG G Sequence 2 T =2/3 brak pełnej zgodności G 3 G G G T C C Sequence 1 slajd 27

28 Metoda okna przykład (6) b) rozmiar okna: 3 - wyjściowa macierz C C * Sequence 2 T * * * * G * G G G T C C Sequence 1 slajd 28

29 Macierze kropkowe - zastosowania Identyfikacja obszarów: - identyczności między dwiema sekwencjami - insercje-delecje: introny - motywy (porównanie sekwencji samej ze sobą) - odwrócone powtórzenia slajd 29

30 Przykład zastosowania porównanie sekwencji samej ze sobą a) identyfikacja motywów (powtarzających się krótkich fragmentów sekwencji a) identyfikacja komplementarnych odwróconych powtórzeń (inverted repeats) - wykorzystywana do określenia struktury drugorzędowej RN (np. spinka do włosów) slajd 30

31 Przykład zastosowania identyfikacja intronów Introny (niekodujące fragmenty genów) są usuwane z mrn w procesie jego dojrzewania Gen } } } } dojrzałe mrn slajd 31

32 Macierze kropkowe - przykładowe narzędzia online Dotmatcher Dottup Dothelix Gepard MatrixPlot slajd 32

33 Podobieństwo a identyczność slajd 33

34 Podobieństwo a identyczność sekwencji dla sekwencji nukleotydowych pojęcia synonimiczne dla sekwencji białkowych: identyczność: procent identycznych reszt aminokwasowych skojarzonych ze sobą podobieństwo: procent przyrównanych reszt, które wykazują zbliżone właściwości fizykochemiczne slajd 34

35 Właściwości aminokwasów Klasyfikacja aminokwasów białkowych ze względu na ich właściwości fizykochemiczne slajd 35

36 Miary podobieństwa i identyczności S podobieństwo I - identyczność metoda 1: metoda 2: slajd 36

37 Strefy przyrównań sekwencji białkowych - strefa bezpieczna (możemy wnioskować o homologii) - strefa cienia (homologia możliwa, ale wymaga potwierdzenia) - strefa ciemności (wnioskujemy o braku homologii) slajd 37

38 lgorytm Needlemana-Wunscha model liniowy slajd 38

39 Programowanie dynamiczne (zasada ogólna) Technika konstrukcji algorytmów mająca zastosowanie do problemów o własności optymalnej podstruktury: optymalne rozwiązanie problemu jest funkcją optymalnych rozwiązań podproblemów. Idea algorytmu polega zatem na podziale zadanego problemu na mniejsze podproblemy. W algorytmie wyczerpującym (sprawdzenie wszystkich możliwych kombinacji) rozwiązanie całego zagadnienia wymaga zwykle wielokrotnego rozwiązania tych samych podproblemów; zysk obliczeniowy w programowaniu dynamicznym otrzymujemy dzięki temu, że każdy podproblem rozwiązujemy tylko raz, zapamiętując te częściowe rozwiązania w pomocniczej strukturze danych (zwykle w macierzy). slajd 39

40 Idea algorytmu Needlemana-Wunscha Wykorzystujemy macierz pomocniczą: podobnie jak w metodzie dot plot zapisujemy dwie porównywane sekwencje jedną w kolumnie, drugą w wierszu. Rozmiar macierzy: (i+1)*(j+1), gdzie i, j: odpowiednio długości sekwencji S1 i S2 Macierz wypełniamy liczbami (punktacja) stosując metodę programowania dynamicznego, tj.oceniając wartość optymalnego dopasowania dla krótszych podsekwencji. W każdym kolejnym kroku badamy jak się zmieni punktacja, jeżeli do wcześniej dopasowanej sekwencji dodamy nukleotyd lub przerwę. slajd 40

41 Idea punktacji Wykorzystujemy system punktacji, pamiętając, że przy ocenie dopasowania musimy uwzględnić nie tylko pozycje, gdzie nukleotydy (bądź aminokwasy) pokrywają się ze sobą (zgodność), ale też niezgodności w dopasowaniu (efekt substytucji), jak i występowanie przerw (efekt insercji lub delecji). Im wyższa punktacja, tym lepsze dopasowanie. slajd 41

42 Obliczanie wartości dopasowania Punkty liczymy dla każdej kolumny dopasowania. Są trzy możliwości: - zgodność (w danej kolumnie są te same nukleotydy / aminokwasy) - niezgodność (w danej kolumnie są różne nukleotydy / aminokwasy) - przerwa (w danej kolumnie występuje symbol - ) Punktacja za zgodność/niezgodność będzie nazywana ogólnie punktacją za dopasowanie, a punktację przerw nazywa się zwykle karą za przerwę. Ostateczna wartość dopasowania pary sekwencji jest sumą punktów obliczonych dla wszystkich kolumn dopasowania. slajd 42

43 Punktacja 1. dopasowanie: a) zgodność (wartość dodatnia, np. +1) niezgodność (zwykle wartość ujemna, np. -1) b) wartości punktowe bierzemy z macierzy substytucji 2. przerwa (wartość ujemna, np. -2) a) jednakowa wartość za każdą przerwę (model liniowy) b) dodatkowa kara za rozpoczęcie przerwy (model afiniczny) 1a) Przy dopasowywaniu sekwencji nukleotydowych stosuje się ustalone punkty za zgodność i niezgodność niezależnie od tego, które nukleotydy są do siebie dopasowane. 1b) Przy dopasowywaniu sekwencji aminokwasowych, punktacja za dopasowanie zwykle uzależniona jest od rodzaju dopasowanych aminokwasów wartości punktowe bierze się z tzw. macierzy substytucji. Sposób punktowania jak i konkretne wartości punktacji nie są sztywno narzucone. Ustala się je w zależności od potrzeb jako parametry algorytmu. slajd 43

44 Punktacja kara za przerwę liniowy model kar za przerwy każda przerwa traktowana jest tak samo; afiniczny model kar za przerwy preferuje łączenie pojedynczych przerw w większe zbitki. Czasem na końcach sekwencji dopuszczamy brak kary za przerwę. Do przemyślenia: Jaki wpływ na dopasowanie mają konkretne wartości poszczególnych elementów punktacji? Co się stanie gdy kara będzie za duża? Za mała? slajd 44

45 Wypełnianie macierzy (model liniowy) przepis Wartości brzegowe: H0,0 = 0 Hi,0 = i*g H0,j = j*g Wartości macierzy dla 1 i S1 i 1 j S2: H macierz punktacji; s funkcja dopasowania symboli ai i bj (punkty dodatnie za zgodność, ujemne za niezgodność lub wg macierzy substytucji [omówione zostaną one na kolejnym wykładzie]) g kara za przerwę (wartość ujemna) slajd 45

46 Działanie algorytmu przykład (1) S1 = TGCTCGT S2 = TTCT Punktacja: zgodność: +5 niezgodność: -2 przerwa: Wypełniamy zerowy wiersz i kolumnę. slajd 46

47 Działanie algorytmu przykład (2) S1 = TGCTCGT S2 = TTCT Punktacja: zgodność: +5 niezgodność: -2 przerwa: Dla każdej komórki wstawiamy największą spośród trzech wartości: a) wartość komórki wyżej po przekątnej + punktacja za dopasowanie b) wartość komórki po lewej + kara za przerwę c) wartość komórki powyżej + kara za przerwę a) = 5 b) -6-6 = -12 c) -6-6 = -12 Zapamiętujemy, skąd się wzięła wpisana wartość (na diagramie czerwona strzałka) slajd 47

48 Działanie algorytmu przykład (3) S1 = TGCTCGT S2 = TTCT Punktacja: zgodność: +5 niezgodność: -2 przerwa: Wartość w prawym dolnym rogu macierzy jest wartością optymalnego dopasowania. Wyznaczamy je na podstawie ścieżki od tego punktu do początku macierzy. slajd 48

49 Działanie algorytmu przykład (4) S1 = TGCTCGT S2 = TTCT 4. Optymalne dopasowanie: Punktacja: zgodność: +5 niezgodność: -2 przerwa: -6 Pionowe kreski w zapisie pomiędzy górną a dolną sekwencją nie są konieczne, zwiększają jednak czytelność, wskazując obszary identyczności w dopasowaniu. slajd 49

50 Rekonstrukcja ścieżki optymalnego dopasowania Odtwarzamy kierunki, dzięki którym uzyskaliśmy dane do macierzy. Każda ścieżka od H[S1][S2] do H[0][0] jest najlepszym dopasowaniem (może istnieć więcej niż jedno). Punktacja w powyższym przykładzie: zgodność +1, niezgodność -1, przerwa -2. Istnieją tu dwa optymalne dopasowania. slajd 50

51 Rekonstrukcja ścieżki implementacja Praktyczna implementacja: a) W trakcie konstrukcji macierzy H, zapamiętujemy w dodatkowych polach (macierz pomocnicza) kierunki, z których przyszliśmy. Rozwiązanie polecane przy niezbyt dużych macierzach, gdy nie ogranicza nas dostępna pamięć. b) Obliczamy te kierunki (proste równania) na bieżąco podczas rekonstrukcji. Jak efektywnie zaimplementować rekonstrukcję wszystkich możliwych optymalnych ścieżek? slajd 51

52 Brak kary za przerwę na końcach sekwencji W implementacji tej wersji algorytmu, w zerowym wierszu i kolumnie wstawiamy same zera, a ścieżkę rekonstruujemy od największej wartości w ostatnim wierszu lub kolumnie (niekoniecznie musi to być prawy dolny róg). slajd 52

53 lgorytm Needlemana-Wunscha model afiniczny slajd 53

54 Kary za przerwy Niech: k długość przerwy; Gp całkowita kara za przerwę Model liniowy: Gp = k*g (każda przerwa traktowana jest tak samo) Model afiniczny: Gp = Go + k*ge,* Go (gap opening) otwarcie przerwy; Ge (gap extension) wydłużenie przerwy; * można się też spotkać z notacją: Gp = Go + (k-1)*ge wówczas Go > Ge slajd 54

55 Kary za przerwy przykład Punktacja zgodność: +1 niezgodność: -1 przerwa: -1 +otwarcie przerwy: -1 S1 = TCT S2 = TTTTT 1) 2) 3) T-C-T TTTTT = -1 TC--T TTTTT = 0 T-C--T TT-TTT = -3 slajd 55 Wg alternatywnej notacji zgodność: +1 niezgodność: -1 otwarcie przerwy: -2 wydłużenie przerwy: -1

56 Model afiniczny konstrukcja macierzy Tworzymy trzy macierze: H, E i F: H i, j H i 1, j 1 + s (ai, b j ) = max Ei, j Fi, j Ei, j H i 1, j + Go + Ge = max Ei 1, j + Ge H i, j 1 + Go + Ge Fi, j = max Fi, j 1 + Ge slajd 56

57 Model afiniczny warunki brzegowe H0,0 = 0 Hi,0 = Go + i*ge H0,j = Go + j*ge E0,0 = - Ei,0 = Go + i*ge E0,j = - F0,0 = - Fi,0 = - F0,j = Go + j*ge slajd 57

58 Model afiniczny rekonstrukcja ścieżki Z Hi,j idziemy do Hi-1,j-1, Ei,j lub Fi,j Z Ei,j idziemy do Ei-1,j, lub Hi-1,j Z Fi,j idziemy do Fi,j-1, lub Hi,j-1 Hi, j H i 1, j 1 + s (ai, b j ) = max Ei, j Fi, j H i 1, j + Go + Ge Ei, j = max Ei 1, j + Ge H i, j 1 + Go + Ge Fi, j = max Fi, j 1 + Ge slajd 58

59 Model afiniczny przykład Z Hi,j idziemy do Hi-1,j-1, Ei,j lub Fi,j Z Ei,j idziemy do Ei-1,j, lub Hi-1,j Z Fi,j idziemy do Fi,j-1, lub Hi,j-1 slajd 59

60 lgorytm Needlemana-Wunscha liniowa złożoność pamięciowa slajd 60

61 Zastosowanie Przydatny, gdy chcemy porównywać długie sekwencje. np. dla porównania dwóch sekwencji o długości nukleotydów każda, potrzeba ok. Tb pamięci dla zapamiętania samej macierzy. slajd 61

62 Obliczanie punktacji Pamiętamy tylko ostatni wiersz (n+2 komórki). slajd 62

63 Poszukiwanie dopasowania - metoda Metoda dziel i zwyciężaj. Stosujemy rekurencyjnie: Idea pojedynczego etapu: W ustalonym wierszu na wysokości połowy rozważanej macierzy znajdujemy punkt o największej wartości dopasowania (szczegóły na następnym slajdzie); w tym miejscu dzielimy macierz na 4 prostokąty. Rozważamy oddzielnie lewy górny i prawy dolny prostokąt, dla każdego z nich powtarzając powyższą procedurę. slajd 63

64 Poszukiwanie dopasowania wybór punktu podziału krok 1) przeprowadzamy dopasowanie dla górnej części, poczynając od punktu [0,0], kończąc na wierszu l0/2. krok 2) przeprowadzamy dopasowanie dla dolnej części od tyłu (czyli dopasowujemy odwrócone sekwencje), poczynając od punktu [l0, l0], kończąc na wierszu l0/2. krok 3) znajdujemy punktację upper dla górnej części macierzy i lower dla dolnej (sekwencja odwrócona). Sumujemy, znajdujemy punkt o najwyższej punktacji. slajd 64

65 Poszukiwanie dopasowania - uściślenie krok 1: cała macierz krok 2: krok 3: 1... krok k: D krok k+1: D1... Jak głęboko schodzimy z rekurencją? Do monentu aż rozmiar podmacierzy pozwoli nam na uruchomienie algorytmu w tradycyjnej formie. slajd 65

66 Ograniczenie algorytmu Needlemana-Wunscha Metody programowania dynamicznego mają zastosowanie dla porównywania par lub niewielkich zbiorów sekwencji. W praktyce zwykle chcemy porównać naszą sekwencję ze wszystkimi sekwencjami zdeponowanymi w bazie metoda staje się zbyt czasochłonna. slajd 66

67

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment Dopasowywanie sekwencji Sequence alignment Drzewo filogenetyczne Kserokopiarka zadanie: skopiować 300 stron. Co może pójść źle? 2x ta sama strona Opuszczona strona Nadmiarowa pusta strona Strona do góry

Bardziej szczegółowo

PRZYRÓWNANIE SEKWENCJI

PRZYRÓWNANIE SEKWENCJI http://theta.edu.pl/ Podstawy Bioinformatyki III PRZYRÓWNANIE SEKWENCJI 1 Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych), które posiadają

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów

Bardziej szczegółowo

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Przyrównanie sekwencji Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych),

Bardziej szczegółowo

Dopasowania par sekwencji DNA

Dopasowania par sekwencji DNA Dopasowania par sekwencji DNA Tworzenie uliniowień (dopasowań, tzw. alignmentów ) par sekwencji PSA Pairwise Sequence Alignment Dopasowania globalne i lokalne ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA

Bardziej szczegółowo

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania

Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania Wprowadzenie do Informatyki Biomedycznej Wykład 2: Metody dopasowywania sekwencji Wydział Informatyki PB Dopasowywanie sekwencji (ang. sequence alignment) Dopasowywanie (przyrównywanie) sekwencji polega

Bardziej szczegółowo

Przyrównywanie sekwencji

Przyrównywanie sekwencji Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański Przyrównywanie sekwencji 1. Porównywanie sekwencji wprowadzenie Sekwencje porównujemy po to, aby

Bardziej szczegółowo

Wykład 5 Dopasowywanie lokalne

Wykład 5 Dopasowywanie lokalne Wykład 5 Dopasowywanie lokalne Dopasowanie par (sekwencji) Dopasowanie globalne C A T W A L K C A T W A L K C O W A R D C X X O X W X A X R X D X Globalne dopasowanie Schemat punktowania (uproszczony)

Bardziej szczegółowo

Dopasowanie sekwencji (sequence alignment)

Dopasowanie sekwencji (sequence alignment) Co to jest alignment? Dopasowanie sekwencji (sequence alignment) Alignment jest sposobem dopasowania struktur pierwszorzędowych DNA, RNA lub białek do zidentyfikowanych regionów w celu określenia podobieństwa;

Bardziej szczegółowo

Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

Bioinformatyka. (wykład monograficzny) wykład 5. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM Bioinformatyka (wykład monograficzny) wykład 5. E. Banachowicz Zakład Biofizyki Molekularnej IF UM http://www.amu.edu.pl/~ewas lgorytmy macierze punktowe (DotPlot) programowanie dynamiczne metody heurystyczne

Bardziej szczegółowo

Wstęp do programowania

Wstęp do programowania Wstęp do programowania Programowanie dynamiczne Paweł Daniluk Wydział Fizyki Jesień 2013 P. Daniluk(Wydział Fizyki) WP w. X Jesień 2013 1 / 21 Dziel i zwyciężaj przypomnienie 1 Podział problemu na 2 lub

Bardziej szczegółowo

Porównywanie i dopasowywanie sekwencji

Porównywanie i dopasowywanie sekwencji Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek pojawiła się nowa możliwość śledzenia ewolucji na poziomie molekularnym Ewolucja

Bardziej szczegółowo

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji Bioinformatyka wykład 5: dopasowanie sekwencji prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie podobieństwa sekwencji stanowi podstawę wielu gałęzi

Bardziej szczegółowo

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010)

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010) Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (19, 26.X.2010) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie

Bardziej szczegółowo

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański BIOINFORMATYKA edycja 2016 / 2017 wykład 11 RNA dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Rola i rodzaje RNA 2. Oddziaływania wewnątrzcząsteczkowe i struktury

Bardziej szczegółowo

Wstęp do programowania

Wstęp do programowania Wstęp do programowania Algorytmy zachłanne, programowanie dynamiczne Paweł Daniluk Wydział Fizyki Jesień 2014 P. Daniluk(Wydział Fizyki) WP w. IX Jesień 2014 1 / 26 Algorytmy zachłanne Strategia polegająca

Bardziej szczegółowo

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012)

Dopasowanie sekwencji Sequence alignment. Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012) Dopasowanie sekwencji Sequence alignment Bioinformatyka, wykłady 3 i 4 (16, 23.X.2012) krzysztof_pawlowski@sggw.pl terminologia alignment 33000 dopasowanie sekwencji 119 uliniowienie sekwencji 82 uliniowianie

Bardziej szczegółowo

Programowanie dynamiczne

Programowanie dynamiczne Programowanie dynamiczne Ciąg Fibonacciego fib(0)=1 fib(1)=1 fib(n)=fib(n-1)+fib(n-2), gdzie n 2 Elementy tego ciągu stanowią liczby naturalne tworzące ciąg o takiej własności, że kolejny wyraz (z wyjątkiem

Bardziej szczegółowo

Porównywanie i dopasowywanie sekwencji

Porównywanie i dopasowywanie sekwencji Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek narodziła się nowa dyscyplina nauki ewolucja molekularna Ewolucja molekularna

Bardziej szczegółowo

Programowanie dynamiczne cz. 2

Programowanie dynamiczne cz. 2 Programowanie dynamiczne cz. 2 Wykład 7 16 kwietnia 2019 (Wykład 7) Programowanie dynamiczne cz. 2 16 kwietnia 2019 1 / 19 Outline 1 Mnożenie ciągu macierzy Konstruowanie optymalnego rozwiązania 2 Podstawy

Bardziej szczegółowo

15. Macierze. Definicja Macierzy. Definicja Delty Kroneckera. Definicja Macierzy Kwadratowej. Definicja Macierzy Jednostkowej

15. Macierze. Definicja Macierzy. Definicja Delty Kroneckera. Definicja Macierzy Kwadratowej. Definicja Macierzy Jednostkowej 15. Macierze Definicja Macierzy. Dla danego ciała F i dla danych m, n IN funkcję A : {1,...,m} {1,...,n} F nazywamy macierzą m n ( macierzą o m wierszach i n kolumnach) o wyrazach z F. Wartość A(i, j)

Bardziej szczegółowo

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji. Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie

Bardziej szczegółowo

Programowanie dynamiczne (optymalizacja dynamiczna).

Programowanie dynamiczne (optymalizacja dynamiczna). Programowanie dynamiczne (optymalizacja dynamiczna). W wielu przypadkach zadania, których złożoność wynikająca z pełnego przeglądu jest duża (zwykle wyk ładnicza) można rozwiązać w czasie wielomianowym

Bardziej szczegółowo

Porównywanie sekwencji białek i kwasów nukleinowych

Porównywanie sekwencji białek i kwasów nukleinowych Porównywanie sekwencji białek i kwasów nukleinowych Krzysztof Lewiński 1. Podobieństwo i jego miara Wprawdzie podobieństwo jest pojęciem często używanym w życiu codziennym ale nie oznacza to, że możemy

Bardziej szczegółowo

Schemat programowania dynamicznego (ang. dynamic programming)

Schemat programowania dynamicznego (ang. dynamic programming) Schemat programowania dynamicznego (ang. dynamic programming) Jest jedną z metod rozwiązywania problemów optymalizacyjnych. Jej twórcą (1957) był amerykański matematyk Richard Ernest Bellman. Schemat ten

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Często dopasować chcemy nie dwie sekwencje ale kilkanaście lub więcej 2 Istnieją dokładne algorytmy, lecz są one niewydajne

Bardziej szczegółowo

Bioinformatyka. Porównywanie sekwencji

Bioinformatyka. Porównywanie sekwencji Bioinformatyka Wykład 5 E. Banachowicz Zakład Biofizyki Molekularnej IF UM 1 http://www.amu.edu.pl/~ewas Porównywanie sekwencji Pierwsze pytanie biologa molekularnego, kiedy odkryje nową sekwencję: zy

Bardziej szczegółowo

Macierze. Rozdział Działania na macierzach

Macierze. Rozdział Działania na macierzach Rozdział 5 Macierze Funkcję, która każdej parze liczb naturalnych (i, j) (i 1,..., n; j 1,..., m) przyporządkowuje dokładnie jedną liczbę a ij F, gdzie F R lub F C, nazywamy macierzą (rzeczywistą, gdy

Bardziej szczegółowo

TEORETYCZNE PODSTAWY INFORMATYKI

TEORETYCZNE PODSTAWY INFORMATYKI 1 TEORETYCZNE PODSTAWY INFORMATYKI 16/01/2017 WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Repetytorium złożoność obliczeniowa 2 Złożoność obliczeniowa Notacja wielkie 0 Notacja Ω i Θ Rozwiązywanie

Bardziej szczegółowo

Polcode Code Contest PHP-10.09

Polcode Code Contest PHP-10.09 Polcode Code Contest PHP-10.09 Przedmiotem konkursu jest napisanie w języku PHP programu, którego wykonanie spowoduje rozwiązanie zadanego problemu i wyświetlenie rezultatu. Zadanie konkursowe Celem zadania

Bardziej szczegółowo

D: Dopasowanie sekwencji. Programowanie dynamiczne

D: Dopasowanie sekwencji. Programowanie dynamiczne D: Dopasowanie sekwencji. Programowanie dynamiczne Problem: jak porównywać sekwencje DNA? Czy te sekwencje są podobne? Jeśli są podobne, to jak mierzyć to podobieństwo? Odpowiedzi są kluczowe dla konstrukcji

Bardziej szczegółowo

Techniki konstruowania algorytmów. Metoda dziel i zwyciężaj

Techniki konstruowania algorytmów. Metoda dziel i zwyciężaj Techniki konstruowania algorytmów Metoda dziel i zwyciężaj Technika dziel i zwyciężaj Aby rozwiązać problem techniką dziel i zwyciężaj musi on wykazywać własność podstruktury rozwiązanie problemu można

Bardziej szczegółowo

Algorytmy i str ruktury danych. Metody algorytmiczne. Bartman Jacek

Algorytmy i str ruktury danych. Metody algorytmiczne. Bartman Jacek Algorytmy i str ruktury danych Metody algorytmiczne Bartman Jacek jbartman@univ.rzeszow.pl Metody algorytmiczne - wprowadzenia Znamy strukturę algorytmów Trudność tkwi natomiast w podaniu metod służących

Bardziej szczegółowo

Bioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee

Bioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee Bioinformatyka 2 (BT172) Wykład 5 Progresywne metody wyznaczania MSA: T-coffee Krzysztof Murzyn 14.XI.2005 PLAN WYKŁADU Ostatnio : definicje, zastosowania MSA, złożoność obliczeniowa algorytmu wyznaczania

Bardziej szczegółowo

Algorytmy kombinatoryczne w bioinformatyce

Algorytmy kombinatoryczne w bioinformatyce lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie

Bardziej szczegółowo

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19 WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19 Witold Dyrka 14 marca 2019 1 Wprowadzenie 1.1 Definicje bioinformatyki Według polskiej Wikipedii [1], Bioinformatyka interdyscyplinarna dziedzina

Bardziej szczegółowo

Statystyczna analiza danych

Statystyczna analiza danych Statystyczna analiza danych ukryte modele Markowa, zastosowania Anna Gambin Instytut Informatyki Uniwersytet Warszawski plan na dziś Ukryte modele Markowa w praktyce modelowania rodzin białek multiuliniowienia

Bardziej szczegółowo

METODA SYMPLEKS. Maciej Patan. Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski

METODA SYMPLEKS. Maciej Patan. Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski METODA SYMPLEKS Maciej Patan Uniwersytet Zielonogórski WSTĘP Algorytm Sympleks najpotężniejsza metoda rozwiązywania programów liniowych Metoda generuje ciąg dopuszczalnych rozwiązań x k w taki sposób,

Bardziej szczegółowo

Zaawansowane algorytmy i struktury danych

Zaawansowane algorytmy i struktury danych Zaawansowane algorytmy i struktury danych u dr Barbary Marszał-Paszek Opracowanie pytań teoretycznych z egzaminów. Strona 1 z 12 Pytania teoretyczne z egzaminu pisemnego z 25 czerwca 2014 (studia dzienne)

Bardziej szczegółowo

Matematyczne Podstawy Informatyki

Matematyczne Podstawy Informatyki Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 2013/2014 Algorytm 1. Termin algorytm jest używany w informatyce

Bardziej szczegółowo

Projektowanie i analiza algorytmów

Projektowanie i analiza algorytmów POLITECHNIKA KRAKOWSKA - WIEiK KATEDRA AUTOMATYKI i TECHNIK INFORMACYJNYCH Projektowanie i analiza algorytmów www.pk.edu.pl/~zk/piaa_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład

Bardziej szczegółowo

3. Wykład Układy równań liniowych.

3. Wykład Układy równań liniowych. 31 Układy równań liniowych 3 Wykład 3 Definicja 31 Niech F będzie ciałem Układem m równań liniowych o niewiadomych x 1,, x n, m, n N, o współczynnikach z ciała F nazywamy układ równań postaci: x 1 + +

Bardziej szczegółowo

Generator testów Bioinformatyka wer / 0 Strona: 1

Generator testów Bioinformatyka wer / 0 Strona: 1 Przedmiot: Nazwa przedmiotu Nazwa testu: Bioinformatyka wer. 1.0.6 Nr testu 0 Klasa: V zaoczne WNB UZ Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Analiza porównawcza białek zwykle zaczyna się na badaniach

Bardziej szczegółowo

Algorytmy sztucznej inteligencji

Algorytmy sztucznej inteligencji www.math.uni.lodz.pl/ radmat Przeszukiwanie z ograniczeniami Zagadnienie przeszukiwania z ograniczeniami stanowi grupę problemów przeszukiwania w przestrzeni stanów, które składa się ze: 1 skończonego

Bardziej szczegółowo

Motywy i podobieństwo

Motywy i podobieństwo Motywy i podobieństwo Całość funkcja Modularna budowa białek Elementy składowe czyli miejsca wiązania, domeny 1 Motywy Motyw jest opisem określonej części trójwymiarowej struktury zawierającym charakterystyczny

Bardziej szczegółowo

Algorytmy kombinatoryczne w bioinformatyce

Algorytmy kombinatoryczne w bioinformatyce lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie

Bardziej szczegółowo

Rozdział 5. Macierze. a 11 a a 1m a 21 a a 2m... a n1 a n2... a nm

Rozdział 5. Macierze. a 11 a a 1m a 21 a a 2m... a n1 a n2... a nm Rozdział 5 Macierze Funkcję, która każdej parze liczb naturalnych (i,j) (i = 1,,n;j = 1,,m) przyporządkowuje dokładnie jedną liczbę a ij F, gdzie F = R lub F = C, nazywamy macierzą (rzeczywistą, gdy F

Bardziej szczegółowo

Metody numeryczne Wykład 4

Metody numeryczne Wykład 4 Metody numeryczne Wykład 4 Dr inż. Michał Łanczont Instytut Elektrotechniki i Elektrotechnologii E419, tel. 4293, m.lanczont@pollub.pl, http://m.lanczont.pollub.pl Zakres wykładu Metody skończone rozwiązywania

Bardziej szczegółowo

Definicja. Ciąg wejściowy: Funkcja uporządkowująca: Sortowanie polega na: a 1, a 2,, a n-1, a n. f(a 1 ) f(a 2 ) f(a n )

Definicja. Ciąg wejściowy: Funkcja uporządkowująca: Sortowanie polega na: a 1, a 2,, a n-1, a n. f(a 1 ) f(a 2 ) f(a n ) SORTOWANIE 1 SORTOWANIE Proces ustawiania zbioru elementów w określonym porządku. Stosuje się w celu ułatwienia późniejszego wyszukiwania elementów sortowanego zbioru. 2 Definicja Ciąg wejściowy: a 1,

Bardziej szczegółowo

Postać Jordana macierzy

Postać Jordana macierzy Rozdział 8 Postać Jordana macierzy Niech F = R lub F = C Macierz J r λ) F r r postaci λ 1 0 0 0 λ 1 J r λ) = 0 λ 1 0 0 λ gdzie λ F nazywamy klatką Jordana stopnia r Oczywiście J 1 λ) = [λ Definicja 81

Bardziej szczegółowo

1 Macierze i wyznaczniki

1 Macierze i wyznaczniki 1 Macierze i wyznaczniki 11 Definicje, twierdzenia, wzory 1 Macierzą rzeczywistą (zespoloną) wymiaru m n, gdzie m N oraz n N, nazywamy prostokątną tablicę złożoną z mn liczb rzeczywistych (zespolonych)

Bardziej szczegółowo

Programowanie dynamiczne i algorytmy zachłanne

Programowanie dynamiczne i algorytmy zachłanne Programowanie dynamiczne i algorytmy zachłanne Tomasz Głowacki tglowacki@cs.put.poznan.pl Zajęcia finansowane z projektu "Rozwój i doskonalenie kształcenia na Politechnice Poznańskiej w zakresie technologii

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Wyszukiwanie sekwencji Jak wyszukad z baz danych bioinformatycznych sekwencje podobne do sekwencji zadanej (ang. query

Bardziej szczegółowo

Algorytmy i Struktury Danych

Algorytmy i Struktury Danych POLITECHNIKA KRAKOWSKA - WIEiK KATEDRA AUTOMATYKI i TECHNIK INFORMACYJNYCH Algorytmy i Struktury Danych www.pk.edu.pl/~zk/aisd_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład 9: Programowanie

Bardziej szczegółowo

Algorytmy i struktury danych. Co dziś? Tytułem przypomnienia metoda dziel i zwyciężaj. Wykład VIII Elementarne techniki algorytmiczne

Algorytmy i struktury danych. Co dziś? Tytułem przypomnienia metoda dziel i zwyciężaj. Wykład VIII Elementarne techniki algorytmiczne Algorytmy i struktury danych Wykład VIII Elementarne techniki algorytmiczne Co dziś? Algorytmy zachłanne (greedyalgorithms) 2 Tytułem przypomnienia metoda dziel i zwyciężaj. Problem można podzielić na

Bardziej szczegółowo

Algorytmy i struktury danych.

Algorytmy i struktury danych. Algorytmy i struktury danych. Wykład 4 Krzysztof M. Ocetkiewicz Krzysztof.Ocetkiewicz@eti.pg.gda.pl Katedra Algorytmów i Modelowania Systemów, WETI, PG Problem plecakowy mamy plecak o określonej pojemności

Bardziej szczegółowo

Programowanie liniowe

Programowanie liniowe Badania operacyjne Problem Model matematyczny Metoda rozwiązania Znaleźć optymalny program produkcji. Zmaksymalizować 1 +3 2 2 3 (1) Przy ograniczeniach 3 1 2 +2 3 7 (2) 2 1 +4 2 12 (3) 4 1 +3 2 +8 3 10

Bardziej szczegółowo

Rozwiązywanie układów równań liniowych

Rozwiązywanie układów równań liniowych Rozwiązywanie układów równań liniowych Marcin Orchel 1 Wstęp Jeśli znamy macierz odwrotną A 1, to możęmy znaleźć rozwiązanie układu Ax = b w wyniku mnożenia x = A 1 b (1) 1.1 Metoda eliminacji Gaussa Pierwszy

Bardziej szczegółowo

Generator testów bioinformatyka wer / Strona: 1

Generator testów bioinformatyka wer / Strona: 1 Przedmiot: wyklad monograficzny Nazwa testu: bioinformatyka wer. 1.0.6 Nr testu 10469906 Klasa: 5 IBOS Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Aminokwas jest to związek organiczny zawierający A) grupę

Bardziej szczegółowo

Strategia "dziel i zwyciężaj"

Strategia dziel i zwyciężaj Strategia "dziel i zwyciężaj" W tej metodzie problem dzielony jest na kilka mniejszych podproblemów podobnych do początkowego problemu. Problemy te rozwiązywane są rekurencyjnie, a następnie rozwiązania

Bardziej szczegółowo

Porównywanie sekwencji białkowych

Porównywanie sekwencji białkowych Bioinformatyka -9 Bioinformatyka Wykład 4. E. Banachowicz Zakład Biofizyki Molekularnej http://www.amu.edu.pl/~ewas Porównywanie sekwencji białkowych Wykład 4, Bioinformatyka -9 Porównywanie sekwencji

Bardziej szczegółowo

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11, 1 Kwantyzacja skalarna Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11, 10.05.005 Kwantyzacja polega na reprezentowaniu dużego zbioru wartości (być może nieskończonego) za pomocą wartości

Bardziej szczegółowo

Wprowadzenie do złożoności obliczeniowej

Wprowadzenie do złożoności obliczeniowej problemów Katedra Informatyki Politechniki Świętokrzyskiej Kielce, 16 stycznia 2007 problemów Plan wykładu 1 2 algorytmów 3 4 5 6 problemów problemów Plan wykładu 1 2 algorytmów 3 4 5 6 problemów problemów

Bardziej szczegółowo

3. Macierze i Układy Równań Liniowych

3. Macierze i Układy Równań Liniowych 3. Macierze i Układy Równań Liniowych Rozważamy równanie macierzowe z końcówki ostatniego wykładu ( ) 3 1 X = 4 1 ( ) 2 5 Podstawiając X = ( ) x y i wymnażając, otrzymujemy układ 2 równań liniowych 3x

Bardziej szczegółowo

Programowanie celowe #1

Programowanie celowe #1 Programowanie celowe #1 Problem programowania celowego (PC) jest przykładem problemu programowania matematycznego nieliniowego, który można skutecznie zlinearyzować, tzn. zapisać (i rozwiązać) jako problem

Bardziej szczegółowo

10. Wstęp do Teorii Gier

10. Wstęp do Teorii Gier 10. Wstęp do Teorii Gier Definicja Gry Matematycznej Gra matematyczna spełnia następujące warunki: a) Jest co najmniej dwóch racjonalnych graczy. b) Zbiór możliwych dezycji każdego gracza zawiera co najmniej

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych...

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych... Przedmowa... XI Część pierwsza Wprowadzenie i biologiczne bazy danych 1 Wprowadzenie... 3 Czym jest bioinformatyka?... 5 Cele... 5 Zakres zainteresowań... 6 Zastosowania... 7 Ograniczenia... 8 Przyszłe

Bardziej szczegółowo

Analiza algorytmów zadania podstawowe

Analiza algorytmów zadania podstawowe Analiza algorytmów zadania podstawowe Zadanie 1 Zliczanie Zliczaj(n) 1 r 0 2 for i 1 to n 1 3 do for j i + 1 to n 4 do for k 1 to j 5 do r r + 1 6 return r 0 Jaka wartość zostanie zwrócona przez powyższą

Bardziej szczegółowo

Reprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów

Reprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów Wykład 2. Reprezentacja komputerowa grafów 1 / 69 Macierz incydencji Niech graf G będzie grafem nieskierowanym bez pętli o n wierzchołkach (x 1, x 2,..., x n) i m krawędziach (e 1, e 2,..., e m). 2 / 69

Bardziej szczegółowo

Obliczenia iteracyjne

Obliczenia iteracyjne Lekcja Strona z Obliczenia iteracyjne Zmienne iteracyjne (wyliczeniowe) Obliczenia iteracyjne wymagają zdefiniowania specjalnej zmiennej nazywanej iteracyjną lub wyliczeniową. Zmienną iteracyjną od zwykłej

Bardziej szczegółowo

Złożoność obliczeniowa zadania, zestaw 2

Złożoność obliczeniowa zadania, zestaw 2 Złożoność obliczeniowa zadania, zestaw 2 Określanie złożoności obliczeniowej algorytmów, obliczanie pesymistycznej i oczekiwanej złożoności obliczeniowej 1. Dana jest tablica jednowymiarowa A o rozmiarze

Bardziej szczegółowo

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II 10 października 2013: Elementarz biologii molekularnej www.bioalgorithms.info Wykład nr 2 BIOINFORMATYKA rok II Komórka: strukturalna i funkcjonalne jednostka organizmu żywego Jądro komórkowe: chroniona

Bardziej szczegółowo

WYKŁAD 3 WYPEŁNIANIE OBSZARÓW. Plan wykładu: 1. Wypełnianie wieloboku

WYKŁAD 3 WYPEŁNIANIE OBSZARÓW. Plan wykładu: 1. Wypełnianie wieloboku WYKŁ 3 WYPŁNINI OSZRÓW. Wypełnianie wieloboku Zasada parzystości: Prosta, która nie przechodzi przez wierzchołek przecina wielobok parzystą ilość razy. Plan wykładu: Wypełnianie wieloboku Wypełnianie konturu

Bardziej szczegółowo

UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH

UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH Transport, studia I stopnia rok akademicki 2011/2012 Instytut L-5, Wydział Inżynierii Lądowej, Politechnika Krakowska Ewa Pabisek Adam Wosatko Uwagi wstępne Układ liniowych równań algebraicznych można

Bardziej szczegółowo

2. Układy równań liniowych

2. Układy równań liniowych 2. Układy równań liniowych Grzegorz Kosiorowski Uniwersytet Ekonomiczny w Krakowie zima 2017/2018 rzegorz Kosiorowski (Uniwersytet Ekonomiczny w Krakowie) 2. Układy równań liniowych zima 2017/2018 1 /

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa 4. Etapy konstrukcji drzewa filogenetycznego

Bardziej szczegółowo

Metody numeryczne I Równania nieliniowe

Metody numeryczne I Równania nieliniowe Metody numeryczne I Równania nieliniowe Janusz Szwabiński szwabin@ift.uni.wroc.pl Metody numeryczne I (C) 2004 Janusz Szwabiński p.1/66 Równania nieliniowe 1. Równania nieliniowe z pojedynczym pierwiastkiem

Bardziej szczegółowo

Generator testów 1.3.1 Bioinformatyka_zdalne wer. 1.0.13 / 0 Strona: 1

Generator testów 1.3.1 Bioinformatyka_zdalne wer. 1.0.13 / 0 Strona: 1 Przedmiot: Bioinformatyka Nazwa testu: Bioinformatyka_zdalne wer. 1.0.13 Nr testu 0 Klasa: WNB UZ Odpowiedzi zaznaczamy TYLKO w tabeli! 1. Model Markowa substytucji aminokwasów w mutagenezie białek zakłada...

Bardziej szczegółowo

O MACIERZACH I UKŁADACH RÓWNAŃ

O MACIERZACH I UKŁADACH RÓWNAŃ O MACIERZACH I UKŁADACH RÓWNAŃ Problem Jak rozwiązać podany układ równań? 2x + 5y 8z = 8 4x + 3y z = 2x + 3y 5z = 7 x + 8y 7z = Definicja Równanie postaci a x + a 2 x 2 + + a n x n = b gdzie a, a 2, a

Bardziej szczegółowo

Wykład z równań różnicowych

Wykład z równań różnicowych Wykład z równań różnicowych 1 Wiadomości wstępne Umówmy się, że na czas tego wykładu zrezygnujemy z oznaczania n-tego wyrazu ciągu symbolem typu x n, y n itp. Zamiast tego pisać będziemy x (n), y (n) itp.

Bardziej szczegółowo

Efektywna metoda sortowania sortowanie przez scalanie

Efektywna metoda sortowania sortowanie przez scalanie Efektywna metoda sortowania sortowanie przez scalanie Rekurencja Dla rozwiązania danego problemu, algorytm wywołuje sam siebie przy rozwiązywaniu podobnych podproblemów. Metoda dziel i zwycięŝaj Dzielimy

Bardziej szczegółowo

Analizy filogenetyczne

Analizy filogenetyczne BIOINFORMATYKA edycja 2016 / 2017 wykład 6 Analizy filogenetyczne dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Cele i zastosowania 2. Podstawy ewolucyjne

Bardziej szczegółowo

Wstęp do programowania INP001213Wcl rok akademicki 2017/18 semestr zimowy. Wykład 9. Karol Tarnowski A-1 p.

Wstęp do programowania INP001213Wcl rok akademicki 2017/18 semestr zimowy. Wykład 9. Karol Tarnowski A-1 p. Wstęp do programowania INP001213Wcl rok akademicki 2017/18 semestr zimowy Wykład 9 Karol Tarnowski karol.tarnowski@pwr.edu.pl A-1 p. 411B Plan prezentacji Zasada dziel i zwyciężaj Przykłady znajdowanie

Bardziej szczegółowo

macierze jednostkowe (identyczności) macierze diagonalne, które na przekątnej mają same

macierze jednostkowe (identyczności) macierze diagonalne, które na przekątnej mają same 1 Macierz definicja i zapis Macierzą wymiaru m na n nazywamy tabelę a 11 a 1n A = a m1 a mn złożoną z liczb (rzeczywistych lub zespolonych) o m wierszach i n kolumnach (zamiennie będziemy też czasem mówili,

Bardziej szczegółowo

Uwaga: Funkcja zamień(a[j],a[j+s]) zamienia miejscami wartości A[j] oraz A[j+s].

Uwaga: Funkcja zamień(a[j],a[j+s]) zamienia miejscami wartości A[j] oraz A[j+s]. Zadanie 1. Wiązka zadań Od szczegółu do ogółu Rozważmy następujący algorytm: Dane: Algorytm 1: k liczba naturalna, A[1...2 k ] tablica liczb całkowitych. n 1 dla i=1,2,,k wykonuj n 2n s 1 dopóki s

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW DOPASOWYWANIE SEKWENCJI 1. Miary podobieństwa sekwencji aminokwasów 2. Zastosowanie programów: CLUSTAL OMEGA BLAST Copyright 2013, Joanna Szyda

Bardziej szczegółowo

Za pierwszy niebanalny algorytm uważa się algorytm Euklidesa wyszukiwanie NWD dwóch liczb (400 a 300 rok przed narodzeniem Chrystusa).

Za pierwszy niebanalny algorytm uważa się algorytm Euklidesa wyszukiwanie NWD dwóch liczb (400 a 300 rok przed narodzeniem Chrystusa). Algorytmy definicja, cechy, złożoność. Algorytmy napotykamy wszędzie, gdziekolwiek się zwrócimy. Rządzą one wieloma codziennymi czynnościami, jak np. wymiana przedziurawionej dętki, montowanie szafy z

Bardziej szczegółowo

Baltie 3. Podręcznik do nauki programowania dla klas I III gimnazjum. Tadeusz Sołtys, Bohumír Soukup

Baltie 3. Podręcznik do nauki programowania dla klas I III gimnazjum. Tadeusz Sołtys, Bohumír Soukup Baltie 3 Podręcznik do nauki programowania dla klas I III gimnazjum Tadeusz Sołtys, Bohumír Soukup Czytanie klawisza lub przycisku myszy Czytaj klawisz lub przycisk myszy - czekaj na naciśnięcie Polecenie

Bardziej szczegółowo

Efektywność algorytmów

Efektywność algorytmów Efektywność algorytmów Algorytmika Algorytmika to dział informatyki zajmujący się poszukiwaniem, konstruowaniem i badaniem własności algorytmów, w kontekście ich przydatności do rozwiązywania problemów

Bardziej szczegółowo

Baza w jądrze i baza obrazu ( )

Baza w jądrze i baza obrazu ( ) Przykład Baza w jądrze i baza obrazu (839) Znajdź bazy jądra i obrazu odwzorowania α : R 4 R 3, gdzie α(x, y, z, t) = (x + 2z + t, 2x + y 3z 5t, x y + z + 4t) () zór ten oznacza, że α jest odwzorowaniem

Bardziej szczegółowo

Porównanie szeregów czasowych z wykorzystaniem algorytmu DTW

Porównanie szeregów czasowych z wykorzystaniem algorytmu DTW Zlot użytkowników R Porównanie szeregów czasowych z wykorzystaniem algorytmu DTW Paweł Teisseyre Instytut Podstaw Informatyki, Polska Akademia Nauk 21 września 2010 Miary podobieństwa między szeregami

Bardziej szczegółowo

Bioinformatyka wykład 8, 27.XI.2012

Bioinformatyka wykład 8, 27.XI.2012 Bioinformatyka wykład 8, 27.XI.2012 białkowa bioinformatyka strukturalna c.d. krzysztof_pawlowski@sggw.pl 2013-01-21 1 Plan wykładu regiony nieuporządkowane sposoby przedstawienia struktur białkowych powierzchnia

Bardziej szczegółowo

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*

Bardziej szczegółowo

; B = Wykonaj poniższe obliczenia: Mnożenia, transpozycje etc wykonuję programem i przepisuję wyniki. Mam nadzieję, że umiesz mnożyć macierze...

; B = Wykonaj poniższe obliczenia: Mnożenia, transpozycje etc wykonuję programem i przepisuję wyniki. Mam nadzieję, że umiesz mnożyć macierze... Tekst na niebiesko jest komentarzem lub treścią zadania. Zadanie. Dane są macierze: A D 0 ; E 0 0 0 ; B 0 5 ; C Wykonaj poniższe obliczenia: 0 4 5 Mnożenia, transpozycje etc wykonuję programem i przepisuję

Bardziej szczegółowo

Sortowanie. LABORKA Piotr Ciskowski

Sortowanie. LABORKA Piotr Ciskowski Sortowanie LABORKA Piotr Ciskowski main Zaimplementuj metody sortowania przedstawione w następnych zadaniach Dla każdej metody osobna funkcja Nagłówek funkcji wg uznania ale wszystkie razem powinny być

Bardziej szczegółowo

UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH

UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH Transport, studia niestacjonarne I stopnia, semestr I Instytut L-5, Wydział Inżynierii Lądowej, Politechnika Krakowska Ewa Pabisek Adam Wosatko Postać układu równań liniowych Układ liniowych równań algebraicznych

Bardziej szczegółowo

Temat: Algorytmy zachłanne

Temat: Algorytmy zachłanne Temat: Algorytmy zachłanne Algorytm zachłanny ( ang. greedy algorithm) wykonuje zawsze działanie, które wydaje się w danej chwili najkorzystniejsze. Wybiera zatem lokalnie optymalną możliwość w nadziei,

Bardziej szczegółowo

Metody Optymalizacji: Przeszukiwanie z listą tabu

Metody Optymalizacji: Przeszukiwanie z listą tabu Metody Optymalizacji: Przeszukiwanie z listą tabu Wojciech Kotłowski Instytut Informatyki Politechniki Poznańskiej email: imię.nazwisko@cs.put.poznan.pl pok. 2 (CW) tel. (61)665-2936 konsultacje: wtorek

Bardziej szczegółowo

Def. Kod jednoznacznie definiowalny Def. Kod przedrostkowy Def. Kod optymalny. Przykłady kodów. Kody optymalne

Def. Kod jednoznacznie definiowalny Def. Kod przedrostkowy Def. Kod optymalny. Przykłady kodów. Kody optymalne Załóżmy, że mamy źródło S, które generuje symbole ze zbioru S={x, x 2,..., x N } z prawdopodobieństwem P={p, p 2,..., p N }, symbolom tym odpowiadają kody P={c, c 2,..., c N }. fektywność danego sposobu

Bardziej szczegółowo