Reswkwencjonowanie vs asemblacja de novo

Wielkość: px
Rozpocząć pokaz od strony:

Download "Reswkwencjonowanie vs asemblacja de novo"

Transkrypt

1 ALEKSANDRA ŚWIERCZ

2 Reswkwencjonowanie vs asemblacja de novo Resekwencjonowanie to odtworzenie badanej sekwencji poprzez mapowanie odczytów do genomu/transkryptomu referencyjnego (tego samego gatunku lub homologicznego). Asemblacja de novo to odtworzenie badanej sekwencji poprzez sklejanie odczytów nakładających się na siebie. Proces sklejania odbywa się wyłącznie w oparciu o odczyty (bez informacji o sekwencji genomu, transkryptu, białek lub homologii). A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 2

3 Human Genome Project Rozpoczął się w 1990 roku porozumienie Departamentu Energetycznego USA oraz Narodowego Instytutu Zdrowia USA Rząd USA zgodził się zainwestować 3 mld$, na okres 15 lat (do 2005r) Do projektu dołączyły także UK, Chiny, Francja, Niemcy i Japonia W 2001 opublikowano 2 niezależne artykuły w Science i Nature opisujące metodologię i opis zsekwencjonowanego genomu ludzkiego przez HGP i Celerę. Pokryte zostało 80-90% genomu Kolejne publikacje w 2003 i 2005 roku uzupełniły luki w genomie HapMap projekt zajmujący się różnicami genetycznymi w genomie ludzkim A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 3

4 Human Genome Project rok Liczba znanych genów niemożliwe ~4,000,000 lat ~1000 lat 2000 ~25,000 wersja robocza Przewidywnany czas potrzebny do zsekwencjonwania całego genomu 2005 ~30,000 Nowa wersja + szympans, kurczak, pies, mysz, świnia, szczur ,384-31,784 Wyzwanie: 1000$ za ludzki genom A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 4

5 Jeffrey P. Tomkins How Genomes are Sequenced and Why it Matters: Implications for Studies in Comparative Genomics of Humans and Chimpanzees Answers Research Journal 4 (2011): A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 5

6 A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 6

7 Human Genome Project Sequencing strategies. Celera Genomics (Venter) Waterston R H et al. PNAS 2002;99:

8 A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 8

9 A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 9

10 IUPAC IUPAC (International Union of Pure and Applied Chemistry) organizacja, która standaryzuje symbolikę nazewnictwo chemiczne. Wynik asemblacji jest reprezentowany w formacie multi-fasta; każdy kontig jest wylistowany, razem z nagłówkiem. Każdy kontig jest ciągiem liter A, C, G, T oraz N symbol nieznanej litery. Czasami jest możliwość zapisu za pomocą innych liter, np.: Y reprezentuje pirymidyny C i T, a R reprezentuje puryny A i G A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 10

11 Film o sekwencjonowaniu A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 11

12 Asemblery, kontigi, scaffoldy Asemblery opierają się na założeniu że odczyty, które zawierają wspólny podciąg, pochodzą z tej samej pozycji w genomie. Poprzez analizę nakładających się podciągów jest możliwa rekonstrukcja sekwencji genomu. Odczyty łączone są w kontigi, kontigi w scaffoldy (superkontigi, metakontigi), a scaffoldy w chromosomy. Kontigi to ciągłe sekwencje (contigous sequence) powstałe w wyniku połączenia odczytów Scaffoldy definiują ułożenie względem siebie kontigów i odległość między nimi. Scaffoldy są następnie umieszczane na odpowiednich chromosomach. A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 12

13 Kontigi, scaffoldy, chromosom A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 13

14 Trudności w asemblacji 1. Odczyty są znacznie krótsze niż sekwencja badanego genomu 2. Trudność w rekonstrukcji zwiększa ogromna liczba odczytów. Nie ma dokładnych metod wyznaczających końcową sekwencję, gdyż nie doczekalibyśmy się końca obliczeń 3. Błędy w odczytach (często rodzaj błędu jest charakterystyczny dla sekwenatora), które uniemożliwiają poprawne złożenie genomu kontigi są krótsze albo wręcz niepoprawne 4. Odczyty pochodzą z obu nici DNA, czyli na wejściu mamy 2 razy więcej sekwencji 5. Nierównomierny rozkład odczytów na genomie niektóre miejsca mogą nie być w ogóle pokryte odczytami 6. Powtórzenia w badanej sekwencji, szczególnie uciążliwe, gdy są dłuższe niż odczyty A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 14

15 Błędy w odczytach insercja CTATGGCTT TATG_CTTG ACTATG_C TG_CTTGCG ACTATG_CTTGCG delecja CTATGGCTT TA_GGCTTG ACTATGGC TGGCTTGCG ACTATGGCTTGCG błędny nukleotyd CTATGGCTT TATGGCCTG ACTATGGC TGGCTTGCG ACTATGGCTTGCG A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 15

16 Odczyty z obu nici sekwencjonowanie asemblacja kontigi A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 16

17 Nierównomierny rozkład odczytów Nie ma możliwości odtworzenia badanej sekwencji, gdyż niektóre jej fragmenty nie są w ogóle pokryte odczytami Stąd też sekwencje wynikowe są często poszatkowane na kontigi A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 17

18 Powtórzenia w badanej sekwencji Zielonego fragmentu nie udało się odtworzyć w sekwencji wynikowej, odczyty powtórzone mylnie zostały połączone, gdyż pochodziły z innych miejsc na chromosomie. Zielony fragment będzie zwrócony jako oddzielny kontig A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 18

19 Powtórzenia w badanej sekwencji Wariant I Wariant II Często powtórzonych fragmentów nie udaje się w całości zrekonstruować A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 19

20 Powtórzenia w badanej sekwencji Powtórzenia są zlokalizowane w jednym miejscu, albo rozprzestrzenione w całym genomie, pomiędzy chromosomami. Powtórzenia dzielimy na różne klasy w zależności od częstości powtórzeń oraz od ich długości. Wyróżniamy: o transpozony wędrujące fragmenty DNA o 2-3 nukleotydowe powtórzenia (w milionach kopii, często zgrupowane w długie bloki) o klasa powtórzeń Alu (~300pz, powtórzone 500tys razy w ludzkim genomie) A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 20

21 Złożoność obliczeniowa Asemblacja de novo jest problemem trudnym obliczeniowo, nawet w wersji bez błędów problem najkrótszego wspólnego superciągu jest problemem silnie NP-trudnym. A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 21

22 Asemblacja sformułowanie problemu Instancja: multizbiór S sekwencji (odczytów) pochodzących z obu nici badanego łańcucha DNA Rozwiązanie: Sekwencja wynikowa o maksymalnej wiarygodności zawierająca, z dopuszczoną pewną liczbą niezgodności, wszystkie sekwencje z S czytane wprost lub jako odwrotnie komplementarne. Ze względu na błędy rozwiązaniem jest często zbiór kontigów (ciągłych fragmentów sekwencji) A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 22

23 Podejścia do asemblacji o Graf nałożeń w grafie wierzchołki są odczytami, a łuki łączą ze sobą wierzchołki, których odczyty nakładają się na siebie. W grafie poszukiwana jest ścieżka przechodząca przez wszystkie wierzchołki (ścieżka Hamiltona). overlap layout consensus o Graf tzw. de Bruijna, graf k-merowy w grafie wierzchołkami są sekwencje o długości k, a odczyty są wrysowywane w graf poprzez połączenie łukami kolejnych wierzchołków A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 23

24 Overlap layout - consensus W celu zbudowania grafu nałożeń należy porównać sekwencje ze sobą, aby wyznaczyć dopasowania. Ze względu na ogromną liczbę odczytów nie można wyznaczyć wszystkich dopasowań potrzebna jest wstępna selekcja i wybór par obiecujących. Wstępna selekcja może się odbywać np. poprzez porównanie k-merów różnych odczytów; para sekwencji, która składa się z wielu takich samych k-merów uznawana jest za obiecującą Dla wybranych par wyznaczane jest dopasowanie metodą dokładną, np. algorytm Smitha-Watermana Ze względu na to że odczyty mogą być z obu nici należy dodać do każdego odczytu a jego sekwencje odwróconą komplementarnie a. Tworzą one często jeden podwójny wierzchołek A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 26

25 Overlap layout - consensus Utworzony graf nałożeń można następnie poprawiać, np. jeśli istnieje łuk między wierzchołkiem a i b, to musi istnieć również łuk między wierzchołkami b i a W grafie szukane są ścieżki, które przechodzą przez jak największą liczbę wierzchołków; można przechodzić tylko przez jeden wierzchołek z pary a lub a Powtórzenia w badanej sekwencji powodują, że w grafie istnieją dwa (lub więcej) rozgałęzienia, a w związku z tym dwie ścieżki, którymi możemy pójść. Nie można łączyć wierzchołków na siłę, gdyż możemy zupełnie źle skleić odczyty A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 27

26 Overlap layout - consensus Jako wynik przeszukiwania grafu otrzymujemy zestaw ścieżek w grafie. Trzeba każdą z nich zamienić na sekwencję konsensusową, inaczej też zwaną kontigiem Jest to problem dopasowania wielu sekwencji. Kolejne sekwencje nakładają się na siebie z przesunięciem; sekwencje mogą zawierać błędy. W efekcie sekwencja konsenusowa może zawierać na niektórych pozycjach nie pojedynczą literę, np. A, lecz informację o prawodopobieństwie wystąpienia litery 62% - A, 38% - G A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 28

27 Overlap layout - consensus Metoda Newbler Początkowo działał w wersji pojedynczych odczytów 100pz, później również dla odczytów dłuższych i sparowanych. Zintegrowany z sekwenatorem 454 Dwie rundy tworzenia i przeglądania grafu. W pierwszej rundzie OLC tworzone są idealne minikontigi (unitigs), które służą jako wstępne, wysoce-pewne kontigi. W drugiej rundzie, tworzone są z nich dłuższe kontigi poprzez porównanie parami minikontigów Specjalne poprawki dla odczytów z błędami homopolimerowymi Metoda CABOG (Celera Assembler) Również dla odczytów 454 (nierówna długość). Jeśli w odczycie pojawiają się homopolimery, to zamieniane są na pojedyncze litery. Korekcja błędów poprzez dopasowanie z innymi odczytami jeśli zbyt dużo błędów w dopasowaniu, połączenie nie jest brane pod uwagę. A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 29

28 Overlap layout - consensus Metoda Edena Adresowana dla odczytów o równej długości: z Illuminy i SOLiD Usuwane są odczyty zduplikowane, a następnie znajdowane są dokładne nałożenia między sekwencjami, o założonej minimalnej długości Nałożenia, które powielają tą samą informację, są usuwane, podobnie jak i błędne ścieżki w grafie wynikające z błędów w odczytach Kontigi są tworzone tylko ze ścieżek bez rozgałęzień A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 30

29 Overlap layout - consensus Wady Przechowywanie odczytów zabiera dużo pamięci Porównanie wszystkich odczytów między sobą jest niewykonalne czasowo Zalety Nie jest tracona informacja tak jak w przypadku rozbijania odczytów na k- mery, w związku z tym metoda jest bardziej odporna na krótkie powtórzenia A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 31

30 Pevznerowskie grafy de Bruijna Każdy odczyt rozbijany jest na krótsze k-mery wierzchołki w grafie, które następnie są połączone ze sobą łukami TTGGCCTAATC k=8 TTGGCCTA TGGCCTAA GGCCTAAT GCCTAATC A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 32

31 Pevznerowskie grafy de Bruijna Połączenie ze sobą dwóch odczytów nakładających się ze sobą w sposób naturalny wydłuża ścieżkę TTGGCCTAATC k=8 GGCCTAATCGT TTGGCCTA TGGCCTAA GGCCTAAT GCCTAATC GGCCTAAT GCCTAATC A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 33

32 Pevznerowskie grafy de Bruijna Błędy w odczycie na jednej pozycji będą powodowały powstawanie dziwnych ścieżek w grafie tzw. bubbles są efektem błędu w środku odczytu tzw. spurs, czyli boczne drogi spowodowane są błędem na końcu odczytu lub brakiem pokrycia w genomie A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 34

33 Pevznerowskie grafy de Bruijna Powtórzenia odczytów, lub powtórzenia fragmentów odczytów będą powodowały kształt postrzępionej liny, tzw. frayed rope cykle, czyli ścieżki zamknięte A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 35

34 Pevznerowskie grafy de Bruijna - zalety Nie ma potrzeby szukania połączeń między odczytami, gdyż one w naturalny sposób łączą się ze sobą, gdy mają wspólne k-mery Przyspieszany jest znacznie czas obliczeń Stały rozmiar pamięci, zależny od wielkości k. Nie są przechowywane całe odczyty, więc nie jest ważne czy odczytów jest dużo, czy więcej. A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 36

35 Pevznerowskie grafy de Bruijna - wady Ze względu, na to że odczyty są dzielone na mniejsze fragmenty, możemy mieć później problem z rekonstrukcją właściwej ścieżki: Podwójna nić odczyty pochodzą z obu nici, trzeba wiec je zduplikować, należy zapewnić, aby przechodzić potem wzdłuż jakiegoś odczytu Palindromy palindromy powodują że ścieżki w grafie zwijają się w siebie Błędy sekwencjonowania powodują powstawanie dodatkowych błędnych ścieżek. Algorytmy radzą sobie w ten sposób, że wstępnie skanują graf (po kilka razy) w celu usunięcia odczytów z błędami. Powtórzenia: odwrócone, tandemowe, niedokładne, zagnieżdżone; wszystkie powtórzenia dłuższe niż k, będą powodowały strukturę postrzępionej liny i będą trudne do rozwiązania pomocą mogą być tu odczyty sparowane A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 37

36 Pevznerowskie grafy de Bruijna Metoda Euler Metoda Pevznera dla odczytów Sangera (Pevzner et al. 2001), odczytów 454 (Chaisson et al. 2004), odczytów Illuminy pojedynczych i sparowanych (Chaisson et al. 2008, 2009). Wstępne filtrowanie błędów, poprzez detekcję rzadko występujących k-merów. Odczyty zawierające te k-mery są albo naprawiane, albo odrzucane (i wykorzystywane do późniejszego sklejania słabo pokrytych miejsc w genomie) Powtórzenia (postrzępiona lina) są rozwiązywane za pomocą odczytów sparowanych Prefiksy odczytów są pewniejsze niż sufiksy utrata jakości w metodach sekwencjonowania Większa wartość k może spowodować że fragmentów genomu słabiej pokrytych nie da się zrekonstruować k-mery sąsiadujących odczytów się nie pokryją. EULER tworzy dwa grafy z różnymi wartościami k. Łuki w grafie o mniejszym k są dodawane i wykorzystywane przez graf o większym k jako mostki, które łączą kontigi w miejscach słabo pokrytych (analogicznie do zapełniania dziur w podejściu OLC) A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 38

37 Pevznerowskie grafy de Bruijna Metoda Velvet Proste ścieżki bez rozgałęzień są zamieniane na pojedynczy wierzchołek Graf jest przeszukiwany w celu znalezienia bąbli, ścieżek bez wyjścia (strategia jest podobna do Eulerowskiej oraz do wygładzania bąbli w grafach nałożeń) W ostatniej fazie łączone są ścieżki na podstawie odczytów sparowanych (mate pairs) Metoda ABySS Działa w środowisku rozproszonym, wykorzystując pamięć wielu komputerów. Wierzchołki grafu są przydzielane do odpowiednich komputerów, w taki sposób, aby k-mer oraz jego komplementarny k-mer trafiły do tego samej jednostki. Strategia podobna do Eulera i Velveta. Jeśli z danego wierzchołka wychodzą łuki do wierzchołków przechowywanych na innym komputerze, to w oczekiwaniu na odpowiedź przetwarzane są inne wierzchołki. A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 39

38 Połączenie DBG i OLC Metoda SOAPdenovo Połączenie technik DBG i OLC z nastawieniem na minimalizację pamięci Wstępne przetwarzanie w celu poprawy błędów w odczytach (częstość występowania k-merów); budowa grafu DBG; rozplatanie fragmentów grafu o kształcie postrzępionej liny; SOAPdenovo w sposób bardziej efektywny pamięciowo niż Velvet i Euler przetwarza graf Kontigi są budowane z odczytów, na podstawie grafu DBG, następnie DBG jest usuwany Tworzony jest graf kontigów; kontigi są wierzchołkami, a łuki łączą kontigi zgodnie ze wskazaniem odczytów sparowanych Aby zapobiec przeplataniu się kontigów, graf przetwarzany jest od małych kontigów do większych A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 40

39 Odczyty sparowane A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 41

40 Podsumowanie Asemblery: Wstępnie przetwarzają odczyty w celu korekcji błędów, usunięcia duplikatów, usunięcia odczytów o słabej jakości, a czasami nawet przycinają końcówki o słabej jakości lub będących pozostałością po adapterach Łączenie ścieżek bez rozgałęzień w grafie w jeden wierzchołek lub po prostu w kontig Próba rozwikłania powtórzeń w sekwencji poprzez wykorzystanie informacji o odczytach sparowanych tworzenie scaffoldów, czyli połączonych ze sobą kontigów, często położonych w pewnej odległości od siebie Są dwa podejścia do asemblacji overlap-layout-consensus oraz grafy de Bruijn a; ze względu ograniczeń pamięciowych te drugie są częściej wykorzystywane Wraz z rozwojem technologicznym będzie wzrastało zapotrzebowanie na asemblery, działające dla większej liczby odczytów, oraz dla dłuższych odczytów A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 42

Sekwencjonowanie, przewidywanie genów

Sekwencjonowanie, przewidywanie genów Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański Sekwencjonowanie, przewidywanie genów 1. Technologie sekwencjonowania Genomem nazywamy sekwencję

Bardziej szczegółowo

Różnorodność osobników gatunku

Różnorodność osobników gatunku ALEKSANDRA ŚWIERCZ Różnorodność osobników gatunku Single Nucleotide Polymorphism (SNP) Różnica na jednej pozycji, małe delecje, insercje (INDELs) SNP pojawia się ~1/1000 pozycji Można je znaleźć porównując

Bardziej szczegółowo

Algorytmy kombinatoryczne w bioinformatyce

Algorytmy kombinatoryczne w bioinformatyce Algorytmy kombinatoryczne w bioinformatyce wykład 2: sekwencjonowanie cz. 1 prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Poznawanie sekwencji genomowej Poznawanie sekwencji

Bardziej szczegółowo

Sekwencjonowanie DNA

Sekwencjonowanie DNA BIOINFORMATYKA edycja 2016 / 2017 wykład 7 Sekwencjonowanie DNA dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Techniki sekwencjonowania 2. Problemy bioinformatyczne

Bardziej szczegółowo

Grafy i sieci wybrane zagadnienia wykład 2: modele służące rekonstrukcji sekwencji

Grafy i sieci wybrane zagadnienia wykład 2: modele służące rekonstrukcji sekwencji Grafy i sieci wybrane zagadnienia wykład 2: modele służące rekonstrukcji sekwencji prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Plan wykładu. Modele grafowe problemu sekwencjonowania

Bardziej szczegółowo

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Poznawanie sekwencji genomowej

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Poznawanie sekwencji genomowej Bioinformatyka wykład 2: sekwencjonowanie cz. 1 prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Poznawanie sekwencji genomowej Poznawanie sekwencji genomów na trzech poziomach

Bardziej szczegółowo

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2 ALEKSANDRA ŚWIERCZ Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2 Ekspresja genów http://genome.wellcome.ac.uk/doc_wtd020757.html A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH

Bardziej szczegółowo

Streszczenie rozprawy doktorskiej Wojciecha Frohmberga pt. GRASShopPER - wydajna metoda asemblacji

Streszczenie rozprawy doktorskiej Wojciecha Frohmberga pt. GRASShopPER - wydajna metoda asemblacji Streszczenie rozprawy doktorskiej Wojciecha Frohmberga pt. GRASShopPER - wydajna metoda asemblacji de novo wykorzystująca strategię Overlap-Layout-Consensus 1. Wstęp Asemblacja DNA stanowi jeden z kluczowych

Bardziej szczegółowo

Przetarg nieograniczony na zakup specjalistycznej aparatury laboratoryjnej Znak sprawy: DZ-2501/6/17

Przetarg nieograniczony na zakup specjalistycznej aparatury laboratoryjnej Znak sprawy: DZ-2501/6/17 Część nr 2: SEKWENATOR NASTĘPNEJ GENERACJI Z ZESTAWEM DEDYKOWANYCH ODCZYNNIKÓW Określenie przedmiotu zamówienia zgodnie ze Wspólnym Słownikiem Zamówień (CPV): 38500000-0 aparatura kontrolna i badawcza

Bardziej szczegółowo

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing. Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing. Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno Macierze tkankowe TMA ang. Tissue microarray Technika opisana w 1987 roku (Wan i

Bardziej szczegółowo

BUDOWA I FUNKCJA GENOMU LUDZKIEGO

BUDOWA I FUNKCJA GENOMU LUDZKIEGO BUDOWA I FUNKCJA GENOMU LUDZKIEGO Magdalena Mayer Katedra i Zakład Genetyki Medycznej UM w Poznaniu 1. Projekt poznania genomu człowieka: Cele programu: - skonstruowanie szczegółowych map fizycznych i

Bardziej szczegółowo

Porównanie algorytmów wyszukiwania najkrótszych ścieżek międz. grafu. Daniel Golubiewski. 22 listopada Instytut Informatyki

Porównanie algorytmów wyszukiwania najkrótszych ścieżek międz. grafu. Daniel Golubiewski. 22 listopada Instytut Informatyki Porównanie algorytmów wyszukiwania najkrótszych ścieżek między wierzchołkami grafu. Instytut Informatyki 22 listopada 2015 Algorytm DFS w głąb Algorytm przejścia/przeszukiwania w głąb (ang. Depth First

Bardziej szczegółowo

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji

prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji Bioinformatyka wykład 5: dopasowanie sekwencji prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie podobieństwa sekwencji stanowi podstawę wielu gałęzi

Bardziej szczegółowo

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Wykład 7 Etapy analizy NGS Dr Wioleta Drobik-Czwarno Etapy analizy NGS Kontrola jakości surowych danych (format fastq) Jakość odczytów,

Bardziej szczegółowo

Przykłady grafów. Graf prosty, to graf bez pętli i bez krawędzi wielokrotnych.

Przykłady grafów. Graf prosty, to graf bez pętli i bez krawędzi wielokrotnych. Grafy Graf Graf (ang. graph) to zbiór wierzchołków (ang. vertices), które mogą być połączone krawędziami (ang. edges) w taki sposób, że każda krawędź kończy się i zaczyna w którymś z wierzchołków. Graf

Bardziej szczegółowo

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI Joanna Szyda Magdalena Frąszczak Magda Mielczarek WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki 3. Projekty NGS 4. Charakterystyka

Bardziej szczegółowo

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment

Politechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment Dopasowywanie sekwencji Sequence alignment Drzewo filogenetyczne Kserokopiarka zadanie: skopiować 300 stron. Co może pójść źle? 2x ta sama strona Opuszczona strona Nadmiarowa pusta strona Strona do góry

Bardziej szczegółowo

Plan wykładów. A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

Plan wykładów. A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2 ALEKSANDRA ŚWIERCZ Plan wykładów Wprowadzenie do różnych metod sekwencjonowania Resekwencjonowanie mapowanie do genomu referencyjnego Sekwencjonowanie de novo asemblacja Różnica w ekspresji genów, alternatywny

Bardziej szczegółowo

Filtrowanie tekstur. Kinga Laurowska

Filtrowanie tekstur. Kinga Laurowska Filtrowanie tekstur Kinga Laurowska Wprowadzenie Filtrowanie tekstur (inaczej wygładzanie) technika polegająca na 'rozmywaniu' sąsiadujących ze sobą tekseli (pikseli tekstury). Istnieje wiele metod filtrowania,

Bardziej szczegółowo

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Wykład 7 Etapy analizy NGS Dr Wioleta Drobik-Czwarno Etapy analizy NGS Kontrola jakości surowych danych (format fastq) Jakość odczytów,

Bardziej szczegółowo

Suma dwóch grafów. Zespolenie dwóch grafów

Suma dwóch grafów. Zespolenie dwóch grafów Suma dwóch grafów G 1 = ((G 1 ), E(G 1 )) G 2 = ((G 2 ), E(G 2 )) (G 1 ) i (G 2 ) rozłączne Suma G 1 G 2 graf ze zbiorem wierzchołków (G 1 ) (G 2 ) i rodziną krawędzi E(G 1 ) E(G 2 ) G 1 G 2 G 1 G 2 Zespolenie

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI

PODSTAWY BIOINFORMATYKI PODSTAWY BIOINFORMATYKI Prowadzący: JOANNA SZYDA ADRIAN DROśDś WSTĘP 1. Katedra Genetyki badania bioinformatyczne 2. Tematyka przedmiotu 3. Charakterystyka wykładów 4. Charakterystyka ćwiczeń 5. Informacje

Bardziej szczegółowo

PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE

PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE D: PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE I. Strategia zachłanna II. Problem przetasowań w genomie III. Sortowanie przez odwrócenia IV. Algorytmy przybliżone V. Algorytm zachłanny

Bardziej szczegółowo

Teoria grafów dla małolatów. Andrzej Przemysław Urbański Instytut Informatyki Politechnika Poznańska

Teoria grafów dla małolatów. Andrzej Przemysław Urbański Instytut Informatyki Politechnika Poznańska Teoria grafów dla małolatów Andrzej Przemysław Urbański Instytut Informatyki Politechnika Poznańska Wstęp Matematyka to wiele różnych dyscyplin Bowiem świat jest bardzo skomplikowany wymaga rozważenia

Bardziej szczegółowo

Algorytm. a programowanie -

Algorytm. a programowanie - Algorytm a programowanie - Program komputerowy: Program komputerowy można rozumieć jako: kod źródłowy - program komputerowy zapisany w pewnym języku programowania, zestaw poszczególnych instrukcji, plik

Bardziej szczegółowo

WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ I ZARZĄDZANIA

WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ I ZARZĄDZANIA DROGI i CYKLE w grafach Dla grafu (nieskierowanego) G = ( V, E ) drogą z wierzchołka v 0 V do v t V nazywamy ciąg (naprzemienny) wierzchołków i krawędzi grafu: ( v 0, e, v, e,..., v t, e t, v t ), spełniający

Bardziej szczegółowo

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI JOANNA SZYDA MAGDALENA FRĄSZCZAK MAGDA MIELCZAREK WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki 3. Projekty NGS 4. Charakterystyka

Bardziej szczegółowo

Struktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott

Struktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott Struktury danych i złożoność obliczeniowa Wykład 7 Prof. dr hab. inż. Jan Magott Problemy NP-zupełne Transformacją wielomianową problemu π 2 do problemu π 1 (π 2 π 1 ) jest funkcja f: D π2 D π1 spełniająca

Bardziej szczegółowo

Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych

Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych ELEMENTY SZTUCZNEJ INTELIGENCJI Laboratorium nr 9 PRZESZUKIWANIE GRAFÓW Z

Bardziej szczegółowo

DNA musi współdziałać z białkami!

DNA musi współdziałać z białkami! DNA musi współdziałać z białkami! Specyficzność oddziaływań między DNA a białkami wiążącymi DNA zależy od: zmian konformacyjnych wzdłuż cząsteczki DNA zróżnicowania struktury DNA wynikającego z sekwencji

Bardziej szczegółowo

Algorytmiczna teoria grafów

Algorytmiczna teoria grafów Przedmiot fakultatywny 20h wykładu + 20h ćwiczeń 21 lutego 2014 Zasady zaliczenia 1 ćwiczenia (ocena): kolokwium, zadania programistyczne (implementacje algorytmów), praca na ćwiczeniach. 2 Wykład (egzamin)

Bardziej szczegółowo

Wstęp do Sztucznej Inteligencji

Wstęp do Sztucznej Inteligencji Wstęp do Sztucznej Inteligencji Rozwiązywanie problemów-i Joanna Kołodziej Politechnika Krakowska Wydział Fizyki, Matematyki i Informatyki Rozwiązywanie problemów Podstawowe fazy: Sformułowanie celu -

Bardziej szczegółowo

Wersja pliku: v.10, 13 kwietnia 2019 zmiany: dodany punkt na temat testów do sprawozdania. Biologia, bioinformatyka:

Wersja pliku: v.10, 13 kwietnia 2019 zmiany: dodany punkt na temat testów do sprawozdania. Biologia, bioinformatyka: Wersja pliku: v.10, 13 kwietnia 2019 zmiany: - 13.04 dodany punkt na temat testów do sprawozdania Biologia, bioinformatyka: 1. DNA kwas deoksyrybonukleinowy. Zbudowany z 4 rodzajów nukleotydów: adeniny,

Bardziej szczegółowo

Wyznaczanie optymalnej trasy problem komiwojażera

Wyznaczanie optymalnej trasy problem komiwojażera Wyznaczanie optymalnej trasy problem komiwojażera Optymalizacja w podejmowaniu decyzji Opracowała: mgr inż. Natalia Malinowska Wrocław, dn. 28.03.2017 Wydział Elektroniki Politechnika Wrocławska Plan prezentacji

Bardziej szczegółowo

Matematyczne Podstawy Informatyki

Matematyczne Podstawy Informatyki Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 03/0 Przeszukiwanie w głąb i wszerz I Przeszukiwanie metodą

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

Algorytmy genetyczne

Algorytmy genetyczne Algorytmy genetyczne Motto: Zamiast pracowicie poszukiwać najlepszego rozwiązania problemu informatycznego lepiej pozwolić, żeby komputer sam sobie to rozwiązanie wyhodował! Algorytmy genetyczne służą

Bardziej szczegółowo

Załącznik 2a: Autoreferat

Załącznik 2a: Autoreferat Załącznik 2a: Autoreferat [1] Imię i nazwisko Aleksandra Świercz [2] Posiadane stopnie i tytuły naukowe 1. Tytuł inżyniera informatyki uzyskany w 2000 roku na Wydziale Elektrycznym Politechniki Poznańskiej

Bardziej szczegółowo

Dopasowanie sekwencji (sequence alignment)

Dopasowanie sekwencji (sequence alignment) Co to jest alignment? Dopasowanie sekwencji (sequence alignment) Alignment jest sposobem dopasowania struktur pierwszorzędowych DNA, RNA lub białek do zidentyfikowanych regionów w celu określenia podobieństwa;

Bardziej szczegółowo

Algorytm genetyczny (genetic algorithm)-

Algorytm genetyczny (genetic algorithm)- Optymalizacja W praktyce inżynierskiej często zachodzi potrzeba znalezienia parametrów, dla których system/urządzenie będzie działać w sposób optymalny. Klasyczne podejście do optymalizacji: sformułowanie

Bardziej szczegółowo

Wstęp do Biologii Obliczeniowej

Wstęp do Biologii Obliczeniowej Wstęp do Biologii Obliczeniowej Zagadnienia na kolokwium Bartek Wilczyński 5. czerwca 2018 Sekwencje DNA i grafy Sekwencje w biologii, DNA, RNA, białka, alfabety, transkrypcja DNA RNA, translacja RNA białko,

Bardziej szczegółowo

PRZYRÓWNANIE SEKWENCJI

PRZYRÓWNANIE SEKWENCJI http://theta.edu.pl/ Podstawy Bioinformatyki III PRZYRÓWNANIE SEKWENCJI 1 Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych), które posiadają

Bardziej szczegółowo

Aproksymacja funkcji a regresja symboliczna

Aproksymacja funkcji a regresja symboliczna Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą

Bardziej szczegółowo

Mapowanie fizyczne genomów -konstrukcja map wyskalowanych w jednostkach fizycznych -najdokładniejszą mapą fizyczną genomu, o największej

Mapowanie fizyczne genomów -konstrukcja map wyskalowanych w jednostkach fizycznych -najdokładniejszą mapą fizyczną genomu, o największej Mapowanie fizyczne genomów -konstrukcja map wyskalowanych w jednostkach fizycznych -najdokładniejszą mapą fizyczną genomu, o największej rozdzielczości jest sekwencja nukleotydowa -mapowanie fizyczne genomu

Bardziej szczegółowo

xx + x = 1, to y = Jeśli x = 0, to y = 0 Przykładowy układ Funkcja przykładowego układu Metody poszukiwania testów Porównanie tabel prawdy

xx + x = 1, to y = Jeśli x = 0, to y = 0 Przykładowy układ Funkcja przykładowego układu Metody poszukiwania testów Porównanie tabel prawdy Testowanie układów kombinacyjnych Przykładowy układ Wykrywanie błędów: 1. Sklejenie z 0 2. Sklejenie z 1 Testem danego uszkodzenia nazywa się takie wzbudzenie funkcji (wektor wejściowy), które daje błędną

Bardziej szczegółowo

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji. Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie

Bardziej szczegółowo

Czy istnieje zamknięta droga spaceru przechodząca przez wszystkie mosty w Królewcu dokładnie jeden raz?

Czy istnieje zamknięta droga spaceru przechodząca przez wszystkie mosty w Królewcu dokładnie jeden raz? DROGI i CYKLE EULERA w grafach Czy istnieje zamknięta droga spaceru przechodząca przez wszystkie mosty w Królewcu dokładnie jeden raz? Czy można narysować podaną figurę nie odrywając ołówka od papieru

Bardziej szczegółowo

Wykład 5 Dopasowywanie lokalne

Wykład 5 Dopasowywanie lokalne Wykład 5 Dopasowywanie lokalne Dopasowanie par (sekwencji) Dopasowanie globalne C A T W A L K C A T W A L K C O W A R D C X X O X W X A X R X D X Globalne dopasowanie Schemat punktowania (uproszczony)

Bardziej szczegółowo

1. System analizy danych NGS z paneli genów

1. System analizy danych NGS z paneli genów 1. System analizy danych NGS z paneli genów (programistyczny) Sekwenator to instrument odczytujący sekwencję DNA w kilku-kilkudziesieciu probkach na raz. Instrument zapisuje na dysku dane w skompresowanych

Bardziej szczegółowo

Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015

Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015 Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015 1 Metody numeryczne Dział matematyki Metody rozwiązywania problemów matematycznych za pomocą operacji na liczbach. Otrzymywane

Bardziej szczegółowo

"Zapisane w genach, czyli Python a tajemnice naszego genomu."

Zapisane w genach, czyli Python a tajemnice naszego genomu. "Zapisane w genach, czyli Python a tajemnice naszego genomu." Dr Kaja Milanowska Instytut Biologii Molekularnej i Biotechnologii UAM VitaInSilica sp. z o.o. Warszawa, 9 lutego 2015 Dane biomedyczne 1)

Bardziej szczegółowo

MATEMATYKA DYSKRETNA - MATERIAŁY DO WYKŁADU GRAFY

MATEMATYKA DYSKRETNA - MATERIAŁY DO WYKŁADU GRAFY ERIAŁY DO WYKŁADU GRAFY Graf nieskierowany Grafem nieskierowanym nazywamy parę G = (V, E), gdzie V jest pewnym zbiorem skończonym (zwanym zbiorem wierzchołków grafu G), natomiast E jest zbiorem nieuporządkowanych

Bardziej szczegółowo

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Paweł Szołtysek 12 czerwca 2008 Streszczenie Planowanie produkcji jest jednym z problemów optymalizacji dyskretnej,

Bardziej szczegółowo

dr inż. Jarosław Forenc

dr inż. Jarosław Forenc Informatyka 2 Politechnika Białostocka - Wydział Elektryczny Elektrotechnika, semestr III, studia stacjonarne I stopnia Rok akademicki 2009/2010 Wykład nr 8 (29.01.2009) dr inż. Jarosław Forenc Rok akademicki

Bardziej szczegółowo

dr inŝ. Jarosław Forenc

dr inŝ. Jarosław Forenc Rok akademicki 2009/2010, Wykład nr 8 2/19 Plan wykładu nr 8 Informatyka 2 Politechnika Białostocka - Wydział Elektryczny Elektrotechnika, semestr III, studia stacjonarne I stopnia Rok akademicki 2009/2010

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych...

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych... Przedmowa... XI Część pierwsza Wprowadzenie i biologiczne bazy danych 1 Wprowadzenie... 3 Czym jest bioinformatyka?... 5 Cele... 5 Zakres zainteresowań... 6 Zastosowania... 7 Ograniczenia... 8 Przyszłe

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE WSTĘP 1. Mikromacierze ekspresyjne tworzenie macierzy przykłady zastosowań 2. Mikromacierze SNP tworzenie macierzy przykłady zastosowań MIKROMACIERZE EKSPRESYJNE

Bardziej szczegółowo

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański BIOINFORMATYKA edycja 2016 / 2017 wykład 11 RNA dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Rola i rodzaje RNA 2. Oddziaływania wewnątrzcząsteczkowe i struktury

Bardziej szczegółowo

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2014/15 Znajdowanie maksimum w zbiorze

Bardziej szczegółowo

Porównywanie i dopasowywanie sekwencji

Porównywanie i dopasowywanie sekwencji Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek pojawiła się nowa możliwość śledzenia ewolucji na poziomie molekularnym Ewolucja

Bardziej szczegółowo

Algorytmy kombinatoryczne w bioinformatyce

Algorytmy kombinatoryczne w bioinformatyce lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie

Bardziej szczegółowo

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych. Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą

Bardziej szczegółowo

Diagram Przepływu Danych - podstawowe bloki składowe i reguły konstrukcji

Diagram Przepływu Danych - podstawowe bloki składowe i reguły konstrukcji Diagramu Przepływu danych - CELE Określenie kluczowych obiektów zewnętrznych będących w interakcji z firmą (systemem); Określenie kluczowych procesów występujących w firmie; Określenie sposobu przepływu

Bardziej szczegółowo

znalezienia elementu w zbiorze, gdy w nim jest; dołączenia nowego elementu w odpowiednie miejsce, aby zbiór pozostał nadal uporządkowany.

znalezienia elementu w zbiorze, gdy w nim jest; dołączenia nowego elementu w odpowiednie miejsce, aby zbiór pozostał nadal uporządkowany. Przedstawiamy algorytmy porządkowania dowolnej liczby elementów, którymi mogą być liczby, jak również elementy o bardziej złożonej postaci (takie jak słowa i daty). Porządkowanie, nazywane również często

Bardziej szczegółowo

Pole wielokąta. Wejście. Wyjście. Przykład

Pole wielokąta. Wejście. Wyjście. Przykład Pole wielokąta Liczba punktów: 60 Limit czasu: 1-3s Limit pamięci: 26MB Oblicz pole wielokąta wypukłego. Wielokąt wypukły jest to wielokąt, który dla dowolnych jego dwóch punktów zawiera również odcinek

Bardziej szczegółowo

Algorytmy kombinatoryczne w bioinformatyce

Algorytmy kombinatoryczne w bioinformatyce lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie

Bardziej szczegółowo

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych autor: Robert Drab opiekun naukowy: dr inż. Paweł Rotter 1. Wstęp Zagadnienie generowania trójwymiarowego

Bardziej szczegółowo

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Przyrównanie sekwencji Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych),

Bardziej szczegółowo

PROCES TWORZENIA DOKUMENTU

PROCES TWORZENIA DOKUMENTU PROCES TWORZENIA DOKUMENTU 1. PLANOWANIE 2. ANALIZA ASPEKTÓW PRAWNYCH I ETYCZNYCH 3. GROMADZENIE INFORMACJI 4. ORGANIZOWANIE (STRUKTURALIZOWANIE) INFORMACJI 5. TWORZENIE PLANU (STRUKTURY) DOKUMENTU 6.

Bardziej szczegółowo

2 Kryptografia: algorytmy symetryczne

2 Kryptografia: algorytmy symetryczne 1 Kryptografia: wstęp Wyróżniamy algorytmy: Kodowanie i kompresja Streszczenie Wieczorowe Studia Licencjackie Wykład 14, 12.06.2007 symetryczne: ten sam klucz jest stosowany do szyfrowania i deszyfrowania;

Bardziej szczegółowo

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny

Bardziej szczegółowo

Matematyka dyskretna. Andrzej Łachwa, UJ, B/14

Matematyka dyskretna. Andrzej Łachwa, UJ, B/14 Matematyka dyskretna Andrzej Łachwa, UJ, 2019 andrzej.lachwa@uj.edu.pl 1B/14 Drogi w grafach Marszruta (trasa) w grafie G z wierzchołka w do wierzchołka u to skończony ciąg krawędzi w postaci. W skrócie

Bardziej szczegółowo

Heurystyki. Strategie poszukiwań

Heurystyki. Strategie poszukiwań Sztuczna inteligencja Heurystyki. Strategie poszukiwań Jacek Bartman Zakład Elektrotechniki i Informatyki Instytut Techniki Uniwersytet Rzeszowski DLACZEGO METODY PRZESZUKIWANIA? Sztuczna Inteligencja

Bardziej szczegółowo

Konspekt do zajęć z przedmiotu Genetyka dla kierunku Położnictwo dr Anna Skorczyk-Werner Katedra i Zakład Genetyki Medycznej

Konspekt do zajęć z przedmiotu Genetyka dla kierunku Położnictwo dr Anna Skorczyk-Werner Katedra i Zakład Genetyki Medycznej Seminarium 1 część 1 Konspekt do zajęć z przedmiotu Genetyka dla kierunku Położnictwo dr Anna Skorczyk-Werner Katedra i Zakład Genetyki Medycznej Genom człowieka Genomem nazywamy całkowitą ilość DNA jaka

Bardziej szczegółowo

PLAN WYKŁADU OPTYMALIZACJA GLOBALNA OPERATOR KRZYŻOWANIA ETAPY KRZYŻOWANIA

PLAN WYKŁADU OPTYMALIZACJA GLOBALNA OPERATOR KRZYŻOWANIA ETAPY KRZYŻOWANIA PLAN WYKŁADU Operator krzyżowania Operator mutacji Operator inwersji Sukcesja Przykłady symulacji AG Kodowanie - rodzaje OPTYMALIZACJA GLOBALNA Wykład 3 dr inż. Agnieszka Bołtuć OPERATOR KRZYŻOWANIA Wymiana

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS

PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS SEKWENCJONOWANIE GENOMÓW NEXT GENERATION METODA NOWEJ GENERACJI Sekwencjonowanie bardzo krótkich fragmentów 50-700 bp DNA unieruchomione na płytce Szybkie

Bardziej szczegółowo

Programowanie współbieżne Wykład 2. Iwona Kochańska

Programowanie współbieżne Wykład 2. Iwona Kochańska Programowanie współbieżne Wykład 2 Iwona Kochańska Miary skalowalności algorytmu równoległego Przyspieszenie Stały rozmiar danych N T(1) - czas obliczeń dla najlepszego algorytmu sekwencyjnego T(p) - czas

Bardziej szczegółowo

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*

Bardziej szczegółowo

Matematyka dyskretna

Matematyka dyskretna Matematyka dyskretna Wykład 13: Teoria Grafów Gniewomir Sarbicki Literatura R.J. Wilson Wprowadzenie do teorii grafów Definicja: Grafem (skończonym, nieskierowanym) G nazywamy parę zbiorów (V (G), E(G)),

Bardziej szczegółowo

Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami

Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami dr inż. Mariusz Uchroński Wrocławskie Centrum Sieciowo-Superkomputerowe Agenda Cykliczny problem przepływowy

Bardziej szczegółowo

DHPLC. Denaturing high performance liquid chromatography. Wiktoria Stańczyk Zofia Kołeczko

DHPLC. Denaturing high performance liquid chromatography. Wiktoria Stańczyk Zofia Kołeczko DHPLC Denaturing high performance liquid chromatography Wiktoria Stańczyk Zofia Kołeczko Mini-słowniczek SNP (Single Nucleotide Polymorphism) - zmienność sekwencji DNA; HET - analiza heterodupleksów; HPLC

Bardziej szczegółowo

Ćwiczenie 12. Diagnostyka molekularna. Poszukiwanie SNPs Odczytywanie danych z sekwencjonowania. Prof. dr hab. Roman Zieliński

Ćwiczenie 12. Diagnostyka molekularna. Poszukiwanie SNPs Odczytywanie danych z sekwencjonowania. Prof. dr hab. Roman Zieliński Ćwiczenie 12 Diagnostyka molekularna. Poszukiwanie SNPs Odczytywanie danych z sekwencjonowania Prof. dr hab. Roman Zieliński 1. Diagnostyka molekularna 1.1. Pytania i zagadnienia 1.1.1. Jak definiujemy

Bardziej szczegółowo

PORÓWNANIE NARZĘDZI DOSTĘPNYCH W OBSZARZE ROBOCZYM SZKICOWNIKA NX Z POLECENIAMI ZAWARTYMI W ANALOGICZNEJ PRZESTRZENI GEOMETRYCZNEJ CATIA V5

PORÓWNANIE NARZĘDZI DOSTĘPNYCH W OBSZARZE ROBOCZYM SZKICOWNIKA NX Z POLECENIAMI ZAWARTYMI W ANALOGICZNEJ PRZESTRZENI GEOMETRYCZNEJ CATIA V5 PORÓWNANIE NARZĘDZI DOSTĘPNYCH W OBSZARZE ROBOCZYM SZKICOWNIKA NX Z POLECENIAMI ZAWARTYMI W ANALOGICZNEJ PRZESTRZENI GEOMETRYCZNEJ CATIA V5 Tworzenie profili o charakterystycznym kształcie NARZĘDZIA, KTÓRE

Bardziej szczegółowo

PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP

PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP WSTĘP 1. SNP 2. haplotyp 3. równowaga sprzężeń 4. zawartość bazy HapMap 5. przykłady zastosowań Copyright 2013, Joanna Szyda HAPMAP BAZA DANYCH HAPMAP - haplotypy

Bardziej szczegółowo

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii 1. Transgeneza - genetycznie zmodyfikowane oraganizmy 2. Medycyna i ochrona zdrowia 3. Genomika poznawanie genomów Przełom XX i

Bardziej szczegółowo

Algorytmy i str ruktury danych. Metody algorytmiczne. Bartman Jacek

Algorytmy i str ruktury danych. Metody algorytmiczne. Bartman Jacek Algorytmy i str ruktury danych Metody algorytmiczne Bartman Jacek jbartman@univ.rzeszow.pl Metody algorytmiczne - wprowadzenia Znamy strukturę algorytmów Trudność tkwi natomiast w podaniu metod służących

Bardziej szczegółowo

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii 1. Technologia rekombinowanego DNA jest podstawą uzyskiwania genetycznie zmodyfikowanych organizmów 2. Medycyna i ochrona zdrowia

Bardziej szczegółowo

AUTOMATYZACJA PROCESÓW DYSKRETNYCH 2012 ALGORYTM SEKWENCJONOWANIA DNA PRZY UŻYCIU CHIPU BINAR- NEGO DLA WSZYSTKICH TYPÓW BŁEDÓW HYBRYDYZACJI

AUTOMATYZACJA PROCESÓW DYSKRETNYCH 2012 ALGORYTM SEKWENCJONOWANIA DNA PRZY UŻYCIU CHIPU BINAR- NEGO DLA WSZYSTKICH TYPÓW BŁEDÓW HYBRYDYZACJI AUTOMATYZACJA PROCESÓW DYSKRETNYCH 2012 Marcin RADOM, Piotr FORMANOWICZ Politechnika Poznańska ALGORYTM SEKWENCJONOWANIA DNA PRZY UŻYCIU CHIPU BINAR- NEGO DLA WSZYSTKICH TYPÓW BŁEDÓW HYBRYDYZACJI Streszczenie.

Bardziej szczegółowo

Bioinformatyka. Program UGENE

Bioinformatyka. Program UGENE Bioinformatyka Program UGENE www.michalbereta.pl UGENE jest darmowym programem do zadań bioinformatycznych. Można go pobrać ze strony http://ugene.net/. 1 1. Wczytanie rekordu z bazy ENA do programu UGENE

Bardziej szczegółowo

Przewidywanie miejsc wiązania nukleosomów w genomie drożdży

Przewidywanie miejsc wiązania nukleosomów w genomie drożdży w genomie drożdży Aleksander Jankowski Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki 8 października 2009 Promotorzy: Jerzy Tiuryn Uniwersytet Warszawski Shyam Prabhakar Genome Institute

Bardziej szczegółowo

OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) Algorytmy i Struktury Danych PIŁA

OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) Algorytmy i Struktury Danych PIŁA OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) 16.01.2003 Algorytmy i Struktury Danych PIŁA ALGORYTMY ZACHŁANNE czas [ms] Porównanie Algorytmów Rozwiązyjących problem TSP 100 000 000 000,000 10 000 000

Bardziej szczegółowo

Przykładowe rozwiązania

Przykładowe rozwiązania Przykładowe rozwiązania Poniższy dokument zawiera przykładowe rozwiązania zadań z I etapu I edycji konkursu (2014 r.). Rozwiązania w formie takiej jak przedstawiona niżej uzyskałyby pełną liczbę punktów

Bardziej szczegółowo

REPREZENTACJA LICZBY, BŁĘDY, ALGORYTMY W OBLICZENIACH

REPREZENTACJA LICZBY, BŁĘDY, ALGORYTMY W OBLICZENIACH REPREZENTACJA LICZBY, BŁĘDY, ALGORYTMY W OBLICZENIACH Transport, studia niestacjonarne I stopnia, semestr I Instytut L-5, Wydział Inżynierii Lądowej, Politechnika Krakowska Adam Wosatko Ewa Pabisek Reprezentacja

Bardziej szczegółowo

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO. Rzeczywistość (istniejąca lub projektowana).. Model fizyczny. 3. Model matematyczny (optymalizacyjny): a. Zmienne projektowania

Bardziej szczegółowo

Porównanie czasów działania algorytmów sortowania przez wstawianie i scalanie

Porównanie czasów działania algorytmów sortowania przez wstawianie i scalanie Więcej o sprawności algorytmów Porównanie czasów działania algorytmów sortowania przez wstawianie i scalanie Załóżmy, że możemy wykonać dane zadanie przy użyciu dwóch algorytmów: jednego o złożoności czasowej

Bardziej szczegółowo

Przygotowanie kilku wersji kodu zgodnie z wymogami wersji zadania,

Przygotowanie kilku wersji kodu zgodnie z wymogami wersji zadania, Przetwarzanie równoległe PROJEKT OMP i CUDA Temat projektu dotyczy analizy efektywności przetwarzania równoległego realizowanego przy użyciu komputera równoległego z procesorem wielordzeniowym z pamięcią

Bardziej szczegółowo