Reswkwencjonowanie vs asemblacja de novo
|
|
- Alojzy Paluch
- 5 lat temu
- Przeglądów:
Transkrypt
1 ALEKSANDRA ŚWIERCZ
2 Reswkwencjonowanie vs asemblacja de novo Resekwencjonowanie to odtworzenie badanej sekwencji poprzez mapowanie odczytów do genomu/transkryptomu referencyjnego (tego samego gatunku lub homologicznego). Asemblacja de novo to odtworzenie badanej sekwencji poprzez sklejanie odczytów nakładających się na siebie. Proces sklejania odbywa się wyłącznie w oparciu o odczyty (bez informacji o sekwencji genomu, transkryptu, białek lub homologii). A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 2
3 Human Genome Project Rozpoczął się w 1990 roku porozumienie Departamentu Energetycznego USA oraz Narodowego Instytutu Zdrowia USA Rząd USA zgodził się zainwestować 3 mld$, na okres 15 lat (do 2005r) Do projektu dołączyły także UK, Chiny, Francja, Niemcy i Japonia W 2001 opublikowano 2 niezależne artykuły w Science i Nature opisujące metodologię i opis zsekwencjonowanego genomu ludzkiego przez HGP i Celerę. Pokryte zostało 80-90% genomu Kolejne publikacje w 2003 i 2005 roku uzupełniły luki w genomie HapMap projekt zajmujący się różnicami genetycznymi w genomie ludzkim A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 3
4 Human Genome Project rok Liczba znanych genów niemożliwe ~4,000,000 lat ~1000 lat 2000 ~25,000 wersja robocza Przewidywnany czas potrzebny do zsekwencjonwania całego genomu 2005 ~30,000 Nowa wersja + szympans, kurczak, pies, mysz, świnia, szczur ,384-31,784 Wyzwanie: 1000$ za ludzki genom A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 4
5 Jeffrey P. Tomkins How Genomes are Sequenced and Why it Matters: Implications for Studies in Comparative Genomics of Humans and Chimpanzees Answers Research Journal 4 (2011): A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 5
6 A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 6
7 Human Genome Project Sequencing strategies. Celera Genomics (Venter) Waterston R H et al. PNAS 2002;99:
8 A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 8
9 A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 9
10 IUPAC IUPAC (International Union of Pure and Applied Chemistry) organizacja, która standaryzuje symbolikę nazewnictwo chemiczne. Wynik asemblacji jest reprezentowany w formacie multi-fasta; każdy kontig jest wylistowany, razem z nagłówkiem. Każdy kontig jest ciągiem liter A, C, G, T oraz N symbol nieznanej litery. Czasami jest możliwość zapisu za pomocą innych liter, np.: Y reprezentuje pirymidyny C i T, a R reprezentuje puryny A i G A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 10
11 Film o sekwencjonowaniu A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 11
12 Asemblery, kontigi, scaffoldy Asemblery opierają się na założeniu że odczyty, które zawierają wspólny podciąg, pochodzą z tej samej pozycji w genomie. Poprzez analizę nakładających się podciągów jest możliwa rekonstrukcja sekwencji genomu. Odczyty łączone są w kontigi, kontigi w scaffoldy (superkontigi, metakontigi), a scaffoldy w chromosomy. Kontigi to ciągłe sekwencje (contigous sequence) powstałe w wyniku połączenia odczytów Scaffoldy definiują ułożenie względem siebie kontigów i odległość między nimi. Scaffoldy są następnie umieszczane na odpowiednich chromosomach. A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 12
13 Kontigi, scaffoldy, chromosom A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 13
14 Trudności w asemblacji 1. Odczyty są znacznie krótsze niż sekwencja badanego genomu 2. Trudność w rekonstrukcji zwiększa ogromna liczba odczytów. Nie ma dokładnych metod wyznaczających końcową sekwencję, gdyż nie doczekalibyśmy się końca obliczeń 3. Błędy w odczytach (często rodzaj błędu jest charakterystyczny dla sekwenatora), które uniemożliwiają poprawne złożenie genomu kontigi są krótsze albo wręcz niepoprawne 4. Odczyty pochodzą z obu nici DNA, czyli na wejściu mamy 2 razy więcej sekwencji 5. Nierównomierny rozkład odczytów na genomie niektóre miejsca mogą nie być w ogóle pokryte odczytami 6. Powtórzenia w badanej sekwencji, szczególnie uciążliwe, gdy są dłuższe niż odczyty A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 14
15 Błędy w odczytach insercja CTATGGCTT TATG_CTTG ACTATG_C TG_CTTGCG ACTATG_CTTGCG delecja CTATGGCTT TA_GGCTTG ACTATGGC TGGCTTGCG ACTATGGCTTGCG błędny nukleotyd CTATGGCTT TATGGCCTG ACTATGGC TGGCTTGCG ACTATGGCTTGCG A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 15
16 Odczyty z obu nici sekwencjonowanie asemblacja kontigi A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 16
17 Nierównomierny rozkład odczytów Nie ma możliwości odtworzenia badanej sekwencji, gdyż niektóre jej fragmenty nie są w ogóle pokryte odczytami Stąd też sekwencje wynikowe są często poszatkowane na kontigi A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 17
18 Powtórzenia w badanej sekwencji Zielonego fragmentu nie udało się odtworzyć w sekwencji wynikowej, odczyty powtórzone mylnie zostały połączone, gdyż pochodziły z innych miejsc na chromosomie. Zielony fragment będzie zwrócony jako oddzielny kontig A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 18
19 Powtórzenia w badanej sekwencji Wariant I Wariant II Często powtórzonych fragmentów nie udaje się w całości zrekonstruować A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 19
20 Powtórzenia w badanej sekwencji Powtórzenia są zlokalizowane w jednym miejscu, albo rozprzestrzenione w całym genomie, pomiędzy chromosomami. Powtórzenia dzielimy na różne klasy w zależności od częstości powtórzeń oraz od ich długości. Wyróżniamy: o transpozony wędrujące fragmenty DNA o 2-3 nukleotydowe powtórzenia (w milionach kopii, często zgrupowane w długie bloki) o klasa powtórzeń Alu (~300pz, powtórzone 500tys razy w ludzkim genomie) A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 20
21 Złożoność obliczeniowa Asemblacja de novo jest problemem trudnym obliczeniowo, nawet w wersji bez błędów problem najkrótszego wspólnego superciągu jest problemem silnie NP-trudnym. A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 21
22 Asemblacja sformułowanie problemu Instancja: multizbiór S sekwencji (odczytów) pochodzących z obu nici badanego łańcucha DNA Rozwiązanie: Sekwencja wynikowa o maksymalnej wiarygodności zawierająca, z dopuszczoną pewną liczbą niezgodności, wszystkie sekwencje z S czytane wprost lub jako odwrotnie komplementarne. Ze względu na błędy rozwiązaniem jest często zbiór kontigów (ciągłych fragmentów sekwencji) A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 22
23 Podejścia do asemblacji o Graf nałożeń w grafie wierzchołki są odczytami, a łuki łączą ze sobą wierzchołki, których odczyty nakładają się na siebie. W grafie poszukiwana jest ścieżka przechodząca przez wszystkie wierzchołki (ścieżka Hamiltona). overlap layout consensus o Graf tzw. de Bruijna, graf k-merowy w grafie wierzchołkami są sekwencje o długości k, a odczyty są wrysowywane w graf poprzez połączenie łukami kolejnych wierzchołków A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 23
24 Overlap layout - consensus W celu zbudowania grafu nałożeń należy porównać sekwencje ze sobą, aby wyznaczyć dopasowania. Ze względu na ogromną liczbę odczytów nie można wyznaczyć wszystkich dopasowań potrzebna jest wstępna selekcja i wybór par obiecujących. Wstępna selekcja może się odbywać np. poprzez porównanie k-merów różnych odczytów; para sekwencji, która składa się z wielu takich samych k-merów uznawana jest za obiecującą Dla wybranych par wyznaczane jest dopasowanie metodą dokładną, np. algorytm Smitha-Watermana Ze względu na to że odczyty mogą być z obu nici należy dodać do każdego odczytu a jego sekwencje odwróconą komplementarnie a. Tworzą one często jeden podwójny wierzchołek A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 26
25 Overlap layout - consensus Utworzony graf nałożeń można następnie poprawiać, np. jeśli istnieje łuk między wierzchołkiem a i b, to musi istnieć również łuk między wierzchołkami b i a W grafie szukane są ścieżki, które przechodzą przez jak największą liczbę wierzchołków; można przechodzić tylko przez jeden wierzchołek z pary a lub a Powtórzenia w badanej sekwencji powodują, że w grafie istnieją dwa (lub więcej) rozgałęzienia, a w związku z tym dwie ścieżki, którymi możemy pójść. Nie można łączyć wierzchołków na siłę, gdyż możemy zupełnie źle skleić odczyty A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 27
26 Overlap layout - consensus Jako wynik przeszukiwania grafu otrzymujemy zestaw ścieżek w grafie. Trzeba każdą z nich zamienić na sekwencję konsensusową, inaczej też zwaną kontigiem Jest to problem dopasowania wielu sekwencji. Kolejne sekwencje nakładają się na siebie z przesunięciem; sekwencje mogą zawierać błędy. W efekcie sekwencja konsenusowa może zawierać na niektórych pozycjach nie pojedynczą literę, np. A, lecz informację o prawodopobieństwie wystąpienia litery 62% - A, 38% - G A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 28
27 Overlap layout - consensus Metoda Newbler Początkowo działał w wersji pojedynczych odczytów 100pz, później również dla odczytów dłuższych i sparowanych. Zintegrowany z sekwenatorem 454 Dwie rundy tworzenia i przeglądania grafu. W pierwszej rundzie OLC tworzone są idealne minikontigi (unitigs), które służą jako wstępne, wysoce-pewne kontigi. W drugiej rundzie, tworzone są z nich dłuższe kontigi poprzez porównanie parami minikontigów Specjalne poprawki dla odczytów z błędami homopolimerowymi Metoda CABOG (Celera Assembler) Również dla odczytów 454 (nierówna długość). Jeśli w odczycie pojawiają się homopolimery, to zamieniane są na pojedyncze litery. Korekcja błędów poprzez dopasowanie z innymi odczytami jeśli zbyt dużo błędów w dopasowaniu, połączenie nie jest brane pod uwagę. A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 29
28 Overlap layout - consensus Metoda Edena Adresowana dla odczytów o równej długości: z Illuminy i SOLiD Usuwane są odczyty zduplikowane, a następnie znajdowane są dokładne nałożenia między sekwencjami, o założonej minimalnej długości Nałożenia, które powielają tą samą informację, są usuwane, podobnie jak i błędne ścieżki w grafie wynikające z błędów w odczytach Kontigi są tworzone tylko ze ścieżek bez rozgałęzień A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 30
29 Overlap layout - consensus Wady Przechowywanie odczytów zabiera dużo pamięci Porównanie wszystkich odczytów między sobą jest niewykonalne czasowo Zalety Nie jest tracona informacja tak jak w przypadku rozbijania odczytów na k- mery, w związku z tym metoda jest bardziej odporna na krótkie powtórzenia A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 31
30 Pevznerowskie grafy de Bruijna Każdy odczyt rozbijany jest na krótsze k-mery wierzchołki w grafie, które następnie są połączone ze sobą łukami TTGGCCTAATC k=8 TTGGCCTA TGGCCTAA GGCCTAAT GCCTAATC A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 32
31 Pevznerowskie grafy de Bruijna Połączenie ze sobą dwóch odczytów nakładających się ze sobą w sposób naturalny wydłuża ścieżkę TTGGCCTAATC k=8 GGCCTAATCGT TTGGCCTA TGGCCTAA GGCCTAAT GCCTAATC GGCCTAAT GCCTAATC A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 33
32 Pevznerowskie grafy de Bruijna Błędy w odczycie na jednej pozycji będą powodowały powstawanie dziwnych ścieżek w grafie tzw. bubbles są efektem błędu w środku odczytu tzw. spurs, czyli boczne drogi spowodowane są błędem na końcu odczytu lub brakiem pokrycia w genomie A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 34
33 Pevznerowskie grafy de Bruijna Powtórzenia odczytów, lub powtórzenia fragmentów odczytów będą powodowały kształt postrzępionej liny, tzw. frayed rope cykle, czyli ścieżki zamknięte A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 35
34 Pevznerowskie grafy de Bruijna - zalety Nie ma potrzeby szukania połączeń między odczytami, gdyż one w naturalny sposób łączą się ze sobą, gdy mają wspólne k-mery Przyspieszany jest znacznie czas obliczeń Stały rozmiar pamięci, zależny od wielkości k. Nie są przechowywane całe odczyty, więc nie jest ważne czy odczytów jest dużo, czy więcej. A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 36
35 Pevznerowskie grafy de Bruijna - wady Ze względu, na to że odczyty są dzielone na mniejsze fragmenty, możemy mieć później problem z rekonstrukcją właściwej ścieżki: Podwójna nić odczyty pochodzą z obu nici, trzeba wiec je zduplikować, należy zapewnić, aby przechodzić potem wzdłuż jakiegoś odczytu Palindromy palindromy powodują że ścieżki w grafie zwijają się w siebie Błędy sekwencjonowania powodują powstawanie dodatkowych błędnych ścieżek. Algorytmy radzą sobie w ten sposób, że wstępnie skanują graf (po kilka razy) w celu usunięcia odczytów z błędami. Powtórzenia: odwrócone, tandemowe, niedokładne, zagnieżdżone; wszystkie powtórzenia dłuższe niż k, będą powodowały strukturę postrzępionej liny i będą trudne do rozwiązania pomocą mogą być tu odczyty sparowane A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 37
36 Pevznerowskie grafy de Bruijna Metoda Euler Metoda Pevznera dla odczytów Sangera (Pevzner et al. 2001), odczytów 454 (Chaisson et al. 2004), odczytów Illuminy pojedynczych i sparowanych (Chaisson et al. 2008, 2009). Wstępne filtrowanie błędów, poprzez detekcję rzadko występujących k-merów. Odczyty zawierające te k-mery są albo naprawiane, albo odrzucane (i wykorzystywane do późniejszego sklejania słabo pokrytych miejsc w genomie) Powtórzenia (postrzępiona lina) są rozwiązywane za pomocą odczytów sparowanych Prefiksy odczytów są pewniejsze niż sufiksy utrata jakości w metodach sekwencjonowania Większa wartość k może spowodować że fragmentów genomu słabiej pokrytych nie da się zrekonstruować k-mery sąsiadujących odczytów się nie pokryją. EULER tworzy dwa grafy z różnymi wartościami k. Łuki w grafie o mniejszym k są dodawane i wykorzystywane przez graf o większym k jako mostki, które łączą kontigi w miejscach słabo pokrytych (analogicznie do zapełniania dziur w podejściu OLC) A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 38
37 Pevznerowskie grafy de Bruijna Metoda Velvet Proste ścieżki bez rozgałęzień są zamieniane na pojedynczy wierzchołek Graf jest przeszukiwany w celu znalezienia bąbli, ścieżek bez wyjścia (strategia jest podobna do Eulerowskiej oraz do wygładzania bąbli w grafach nałożeń) W ostatniej fazie łączone są ścieżki na podstawie odczytów sparowanych (mate pairs) Metoda ABySS Działa w środowisku rozproszonym, wykorzystując pamięć wielu komputerów. Wierzchołki grafu są przydzielane do odpowiednich komputerów, w taki sposób, aby k-mer oraz jego komplementarny k-mer trafiły do tego samej jednostki. Strategia podobna do Eulera i Velveta. Jeśli z danego wierzchołka wychodzą łuki do wierzchołków przechowywanych na innym komputerze, to w oczekiwaniu na odpowiedź przetwarzane są inne wierzchołki. A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 39
38 Połączenie DBG i OLC Metoda SOAPdenovo Połączenie technik DBG i OLC z nastawieniem na minimalizację pamięci Wstępne przetwarzanie w celu poprawy błędów w odczytach (częstość występowania k-merów); budowa grafu DBG; rozplatanie fragmentów grafu o kształcie postrzępionej liny; SOAPdenovo w sposób bardziej efektywny pamięciowo niż Velvet i Euler przetwarza graf Kontigi są budowane z odczytów, na podstawie grafu DBG, następnie DBG jest usuwany Tworzony jest graf kontigów; kontigi są wierzchołkami, a łuki łączą kontigi zgodnie ze wskazaniem odczytów sparowanych Aby zapobiec przeplataniu się kontigów, graf przetwarzany jest od małych kontigów do większych A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 40
39 Odczyty sparowane A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 41
40 Podsumowanie Asemblery: Wstępnie przetwarzają odczyty w celu korekcji błędów, usunięcia duplikatów, usunięcia odczytów o słabej jakości, a czasami nawet przycinają końcówki o słabej jakości lub będących pozostałością po adapterach Łączenie ścieżek bez rozgałęzień w grafie w jeden wierzchołek lub po prostu w kontig Próba rozwikłania powtórzeń w sekwencji poprzez wykorzystanie informacji o odczytach sparowanych tworzenie scaffoldów, czyli połączonych ze sobą kontigów, często położonych w pewnej odległości od siebie Są dwa podejścia do asemblacji overlap-layout-consensus oraz grafy de Bruijn a; ze względu ograniczeń pamięciowych te drugie są częściej wykorzystywane Wraz z rozwojem technologicznym będzie wzrastało zapotrzebowanie na asemblery, działające dla większej liczby odczytów, oraz dla dłuższych odczytów A. Świercz PRZETWARZANIE DANYCH WYSOKOPRZEPUSTOWYCH 42
Sekwencjonowanie, przewidywanie genów
Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański Sekwencjonowanie, przewidywanie genów 1. Technologie sekwencjonowania Genomem nazywamy sekwencję
Bardziej szczegółowoRóżnorodność osobników gatunku
ALEKSANDRA ŚWIERCZ Różnorodność osobników gatunku Single Nucleotide Polymorphism (SNP) Różnica na jednej pozycji, małe delecje, insercje (INDELs) SNP pojawia się ~1/1000 pozycji Można je znaleźć porównując
Bardziej szczegółowoAlgorytmy kombinatoryczne w bioinformatyce
Algorytmy kombinatoryczne w bioinformatyce wykład 2: sekwencjonowanie cz. 1 prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Poznawanie sekwencji genomowej Poznawanie sekwencji
Bardziej szczegółowoSekwencjonowanie DNA
BIOINFORMATYKA edycja 2016 / 2017 wykład 7 Sekwencjonowanie DNA dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Techniki sekwencjonowania 2. Problemy bioinformatyczne
Bardziej szczegółowoGrafy i sieci wybrane zagadnienia wykład 2: modele służące rekonstrukcji sekwencji
Grafy i sieci wybrane zagadnienia wykład 2: modele służące rekonstrukcji sekwencji prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Plan wykładu. Modele grafowe problemu sekwencjonowania
Bardziej szczegółowoprof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Poznawanie sekwencji genomowej
Bioinformatyka wykład 2: sekwencjonowanie cz. 1 prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Poznawanie sekwencji genomowej Poznawanie sekwencji genomów na trzech poziomach
Bardziej szczegółowoCo to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2
ALEKSANDRA ŚWIERCZ Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2 Ekspresja genów http://genome.wellcome.ac.uk/doc_wtd020757.html A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH
Bardziej szczegółowoStreszczenie rozprawy doktorskiej Wojciecha Frohmberga pt. GRASShopPER - wydajna metoda asemblacji
Streszczenie rozprawy doktorskiej Wojciecha Frohmberga pt. GRASShopPER - wydajna metoda asemblacji de novo wykorzystująca strategię Overlap-Layout-Consensus 1. Wstęp Asemblacja DNA stanowi jeden z kluczowych
Bardziej szczegółowoPrzetarg nieograniczony na zakup specjalistycznej aparatury laboratoryjnej Znak sprawy: DZ-2501/6/17
Część nr 2: SEKWENATOR NASTĘPNEJ GENERACJI Z ZESTAWEM DEDYKOWANYCH ODCZYNNIKÓW Określenie przedmiotu zamówienia zgodnie ze Wspólnym Słownikiem Zamówień (CPV): 38500000-0 aparatura kontrolna i badawcza
Bardziej szczegółowoSekwencjonowanie Nowej Generacji ang. Next Generation Sequencing. Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno
Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno Macierze tkankowe TMA ang. Tissue microarray Technika opisana w 1987 roku (Wan i
Bardziej szczegółowoBUDOWA I FUNKCJA GENOMU LUDZKIEGO
BUDOWA I FUNKCJA GENOMU LUDZKIEGO Magdalena Mayer Katedra i Zakład Genetyki Medycznej UM w Poznaniu 1. Projekt poznania genomu człowieka: Cele programu: - skonstruowanie szczegółowych map fizycznych i
Bardziej szczegółowoPorównanie algorytmów wyszukiwania najkrótszych ścieżek międz. grafu. Daniel Golubiewski. 22 listopada Instytut Informatyki
Porównanie algorytmów wyszukiwania najkrótszych ścieżek między wierzchołkami grafu. Instytut Informatyki 22 listopada 2015 Algorytm DFS w głąb Algorytm przejścia/przeszukiwania w głąb (ang. Depth First
Bardziej szczegółowoprof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji
Bioinformatyka wykład 5: dopasowanie sekwencji prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie podobieństwa sekwencji stanowi podstawę wielu gałęzi
Bardziej szczegółowoSekwencjonowanie Nowej Generacji ang. Next Generation Sequencing
Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Wykład 7 Etapy analizy NGS Dr Wioleta Drobik-Czwarno Etapy analizy NGS Kontrola jakości surowych danych (format fastq) Jakość odczytów,
Bardziej szczegółowoPrzykłady grafów. Graf prosty, to graf bez pętli i bez krawędzi wielokrotnych.
Grafy Graf Graf (ang. graph) to zbiór wierzchołków (ang. vertices), które mogą być połączone krawędziami (ang. edges) w taki sposób, że każda krawędź kończy się i zaczyna w którymś z wierzchołków. Graf
Bardziej szczegółowoANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI
ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI Joanna Szyda Magdalena Frąszczak Magda Mielczarek WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki 3. Projekty NGS 4. Charakterystyka
Bardziej szczegółowoPolitechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment
Dopasowywanie sekwencji Sequence alignment Drzewo filogenetyczne Kserokopiarka zadanie: skopiować 300 stron. Co może pójść źle? 2x ta sama strona Opuszczona strona Nadmiarowa pusta strona Strona do góry
Bardziej szczegółowoPlan wykładów. A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2
ALEKSANDRA ŚWIERCZ Plan wykładów Wprowadzenie do różnych metod sekwencjonowania Resekwencjonowanie mapowanie do genomu referencyjnego Sekwencjonowanie de novo asemblacja Różnica w ekspresji genów, alternatywny
Bardziej szczegółowoFiltrowanie tekstur. Kinga Laurowska
Filtrowanie tekstur Kinga Laurowska Wprowadzenie Filtrowanie tekstur (inaczej wygładzanie) technika polegająca na 'rozmywaniu' sąsiadujących ze sobą tekseli (pikseli tekstury). Istnieje wiele metod filtrowania,
Bardziej szczegółowoSekwencjonowanie Nowej Generacji ang. Next Generation Sequencing
Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Wykład 7 Etapy analizy NGS Dr Wioleta Drobik-Czwarno Etapy analizy NGS Kontrola jakości surowych danych (format fastq) Jakość odczytów,
Bardziej szczegółowoSuma dwóch grafów. Zespolenie dwóch grafów
Suma dwóch grafów G 1 = ((G 1 ), E(G 1 )) G 2 = ((G 2 ), E(G 2 )) (G 1 ) i (G 2 ) rozłączne Suma G 1 G 2 graf ze zbiorem wierzchołków (G 1 ) (G 2 ) i rodziną krawędzi E(G 1 ) E(G 2 ) G 1 G 2 G 1 G 2 Zespolenie
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI
PODSTAWY BIOINFORMATYKI Prowadzący: JOANNA SZYDA ADRIAN DROśDś WSTĘP 1. Katedra Genetyki badania bioinformatyczne 2. Tematyka przedmiotu 3. Charakterystyka wykładów 4. Charakterystyka ćwiczeń 5. Informacje
Bardziej szczegółowoPROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE
D: PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE I. Strategia zachłanna II. Problem przetasowań w genomie III. Sortowanie przez odwrócenia IV. Algorytmy przybliżone V. Algorytm zachłanny
Bardziej szczegółowoTeoria grafów dla małolatów. Andrzej Przemysław Urbański Instytut Informatyki Politechnika Poznańska
Teoria grafów dla małolatów Andrzej Przemysław Urbański Instytut Informatyki Politechnika Poznańska Wstęp Matematyka to wiele różnych dyscyplin Bowiem świat jest bardzo skomplikowany wymaga rozważenia
Bardziej szczegółowoAlgorytm. a programowanie -
Algorytm a programowanie - Program komputerowy: Program komputerowy można rozumieć jako: kod źródłowy - program komputerowy zapisany w pewnym języku programowania, zestaw poszczególnych instrukcji, plik
Bardziej szczegółowoWYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ I ZARZĄDZANIA
DROGI i CYKLE w grafach Dla grafu (nieskierowanego) G = ( V, E ) drogą z wierzchołka v 0 V do v t V nazywamy ciąg (naprzemienny) wierzchołków i krawędzi grafu: ( v 0, e, v, e,..., v t, e t, v t ), spełniający
Bardziej szczegółowoANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI
ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI JOANNA SZYDA MAGDALENA FRĄSZCZAK MAGDA MIELCZAREK WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki 3. Projekty NGS 4. Charakterystyka
Bardziej szczegółowoStruktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott
Struktury danych i złożoność obliczeniowa Wykład 7 Prof. dr hab. inż. Jan Magott Problemy NP-zupełne Transformacją wielomianową problemu π 2 do problemu π 1 (π 2 π 1 ) jest funkcja f: D π2 D π1 spełniająca
Bardziej szczegółowoUniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych ELEMENTY SZTUCZNEJ INTELIGENCJI Laboratorium nr 9 PRZESZUKIWANIE GRAFÓW Z
Bardziej szczegółowoDNA musi współdziałać z białkami!
DNA musi współdziałać z białkami! Specyficzność oddziaływań między DNA a białkami wiążącymi DNA zależy od: zmian konformacyjnych wzdłuż cząsteczki DNA zróżnicowania struktury DNA wynikającego z sekwencji
Bardziej szczegółowoAlgorytmiczna teoria grafów
Przedmiot fakultatywny 20h wykładu + 20h ćwiczeń 21 lutego 2014 Zasady zaliczenia 1 ćwiczenia (ocena): kolokwium, zadania programistyczne (implementacje algorytmów), praca na ćwiczeniach. 2 Wykład (egzamin)
Bardziej szczegółowoWstęp do Sztucznej Inteligencji
Wstęp do Sztucznej Inteligencji Rozwiązywanie problemów-i Joanna Kołodziej Politechnika Krakowska Wydział Fizyki, Matematyki i Informatyki Rozwiązywanie problemów Podstawowe fazy: Sformułowanie celu -
Bardziej szczegółowoWersja pliku: v.10, 13 kwietnia 2019 zmiany: dodany punkt na temat testów do sprawozdania. Biologia, bioinformatyka:
Wersja pliku: v.10, 13 kwietnia 2019 zmiany: - 13.04 dodany punkt na temat testów do sprawozdania Biologia, bioinformatyka: 1. DNA kwas deoksyrybonukleinowy. Zbudowany z 4 rodzajów nukleotydów: adeniny,
Bardziej szczegółowoWyznaczanie optymalnej trasy problem komiwojażera
Wyznaczanie optymalnej trasy problem komiwojażera Optymalizacja w podejmowaniu decyzji Opracowała: mgr inż. Natalia Malinowska Wrocław, dn. 28.03.2017 Wydział Elektroniki Politechnika Wrocławska Plan prezentacji
Bardziej szczegółowoMatematyczne Podstawy Informatyki
Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 03/0 Przeszukiwanie w głąb i wszerz I Przeszukiwanie metodą
Bardziej szczegółowoTestowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Bardziej szczegółowoAlgorytmy genetyczne
Algorytmy genetyczne Motto: Zamiast pracowicie poszukiwać najlepszego rozwiązania problemu informatycznego lepiej pozwolić, żeby komputer sam sobie to rozwiązanie wyhodował! Algorytmy genetyczne służą
Bardziej szczegółowoZałącznik 2a: Autoreferat
Załącznik 2a: Autoreferat [1] Imię i nazwisko Aleksandra Świercz [2] Posiadane stopnie i tytuły naukowe 1. Tytuł inżyniera informatyki uzyskany w 2000 roku na Wydziale Elektrycznym Politechniki Poznańskiej
Bardziej szczegółowoDopasowanie sekwencji (sequence alignment)
Co to jest alignment? Dopasowanie sekwencji (sequence alignment) Alignment jest sposobem dopasowania struktur pierwszorzędowych DNA, RNA lub białek do zidentyfikowanych regionów w celu określenia podobieństwa;
Bardziej szczegółowoAlgorytm genetyczny (genetic algorithm)-
Optymalizacja W praktyce inżynierskiej często zachodzi potrzeba znalezienia parametrów, dla których system/urządzenie będzie działać w sposób optymalny. Klasyczne podejście do optymalizacji: sformułowanie
Bardziej szczegółowoWstęp do Biologii Obliczeniowej
Wstęp do Biologii Obliczeniowej Zagadnienia na kolokwium Bartek Wilczyński 5. czerwca 2018 Sekwencje DNA i grafy Sekwencje w biologii, DNA, RNA, białka, alfabety, transkrypcja DNA RNA, translacja RNA białko,
Bardziej szczegółowoPRZYRÓWNANIE SEKWENCJI
http://theta.edu.pl/ Podstawy Bioinformatyki III PRZYRÓWNANIE SEKWENCJI 1 Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych), które posiadają
Bardziej szczegółowoAproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Bardziej szczegółowoMapowanie fizyczne genomów -konstrukcja map wyskalowanych w jednostkach fizycznych -najdokładniejszą mapą fizyczną genomu, o największej
Mapowanie fizyczne genomów -konstrukcja map wyskalowanych w jednostkach fizycznych -najdokładniejszą mapą fizyczną genomu, o największej rozdzielczości jest sekwencja nukleotydowa -mapowanie fizyczne genomu
Bardziej szczegółowoxx + x = 1, to y = Jeśli x = 0, to y = 0 Przykładowy układ Funkcja przykładowego układu Metody poszukiwania testów Porównanie tabel prawdy
Testowanie układów kombinacyjnych Przykładowy układ Wykrywanie błędów: 1. Sklejenie z 0 2. Sklejenie z 1 Testem danego uszkodzenia nazywa się takie wzbudzenie funkcji (wektor wejściowy), które daje błędną
Bardziej szczegółowoBioinformatyka. Ocena wiarygodności dopasowania sekwencji.
Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie
Bardziej szczegółowoCzy istnieje zamknięta droga spaceru przechodząca przez wszystkie mosty w Królewcu dokładnie jeden raz?
DROGI i CYKLE EULERA w grafach Czy istnieje zamknięta droga spaceru przechodząca przez wszystkie mosty w Królewcu dokładnie jeden raz? Czy można narysować podaną figurę nie odrywając ołówka od papieru
Bardziej szczegółowoWykład 5 Dopasowywanie lokalne
Wykład 5 Dopasowywanie lokalne Dopasowanie par (sekwencji) Dopasowanie globalne C A T W A L K C A T W A L K C O W A R D C X X O X W X A X R X D X Globalne dopasowanie Schemat punktowania (uproszczony)
Bardziej szczegółowo1. System analizy danych NGS z paneli genów
1. System analizy danych NGS z paneli genów (programistyczny) Sekwenator to instrument odczytujący sekwencję DNA w kilku-kilkudziesieciu probkach na raz. Instrument zapisuje na dysku dane w skompresowanych
Bardziej szczegółowoMetody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015
Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015 1 Metody numeryczne Dział matematyki Metody rozwiązywania problemów matematycznych za pomocą operacji na liczbach. Otrzymywane
Bardziej szczegółowo"Zapisane w genach, czyli Python a tajemnice naszego genomu."
"Zapisane w genach, czyli Python a tajemnice naszego genomu." Dr Kaja Milanowska Instytut Biologii Molekularnej i Biotechnologii UAM VitaInSilica sp. z o.o. Warszawa, 9 lutego 2015 Dane biomedyczne 1)
Bardziej szczegółowoMATEMATYKA DYSKRETNA - MATERIAŁY DO WYKŁADU GRAFY
ERIAŁY DO WYKŁADU GRAFY Graf nieskierowany Grafem nieskierowanym nazywamy parę G = (V, E), gdzie V jest pewnym zbiorem skończonym (zwanym zbiorem wierzchołków grafu G), natomiast E jest zbiorem nieuporządkowanych
Bardziej szczegółowoBadania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle
Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Paweł Szołtysek 12 czerwca 2008 Streszczenie Planowanie produkcji jest jednym z problemów optymalizacji dyskretnej,
Bardziej szczegółowodr inż. Jarosław Forenc
Informatyka 2 Politechnika Białostocka - Wydział Elektryczny Elektrotechnika, semestr III, studia stacjonarne I stopnia Rok akademicki 2009/2010 Wykład nr 8 (29.01.2009) dr inż. Jarosław Forenc Rok akademicki
Bardziej szczegółowodr inŝ. Jarosław Forenc
Rok akademicki 2009/2010, Wykład nr 8 2/19 Plan wykładu nr 8 Informatyka 2 Politechnika Białostocka - Wydział Elektryczny Elektrotechnika, semestr III, studia stacjonarne I stopnia Rok akademicki 2009/2010
Bardziej szczegółowoSpis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych...
Przedmowa... XI Część pierwsza Wprowadzenie i biologiczne bazy danych 1 Wprowadzenie... 3 Czym jest bioinformatyka?... 5 Cele... 5 Zakres zainteresowań... 6 Zastosowania... 7 Ograniczenia... 8 Przyszłe
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE
PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE WSTĘP 1. Mikromacierze ekspresyjne tworzenie macierzy przykłady zastosowań 2. Mikromacierze SNP tworzenie macierzy przykłady zastosowań MIKROMACIERZE EKSPRESYJNE
Bardziej szczegółowoBIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański
BIOINFORMATYKA edycja 2016 / 2017 wykład 11 RNA dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Rola i rodzaje RNA 2. Oddziaływania wewnątrzcząsteczkowe i struktury
Bardziej szczegółowoAlgorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych
Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2014/15 Znajdowanie maksimum w zbiorze
Bardziej szczegółowoPorównywanie i dopasowywanie sekwencji
Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek pojawiła się nowa możliwość śledzenia ewolucji na poziomie molekularnym Ewolucja
Bardziej szczegółowoAlgorytmy kombinatoryczne w bioinformatyce
lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie
Bardziej szczegółowow analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Bardziej szczegółowoDiagram Przepływu Danych - podstawowe bloki składowe i reguły konstrukcji
Diagramu Przepływu danych - CELE Określenie kluczowych obiektów zewnętrznych będących w interakcji z firmą (systemem); Określenie kluczowych procesów występujących w firmie; Określenie sposobu przepływu
Bardziej szczegółowoznalezienia elementu w zbiorze, gdy w nim jest; dołączenia nowego elementu w odpowiednie miejsce, aby zbiór pozostał nadal uporządkowany.
Przedstawiamy algorytmy porządkowania dowolnej liczby elementów, którymi mogą być liczby, jak również elementy o bardziej złożonej postaci (takie jak słowa i daty). Porządkowanie, nazywane również często
Bardziej szczegółowoPole wielokąta. Wejście. Wyjście. Przykład
Pole wielokąta Liczba punktów: 60 Limit czasu: 1-3s Limit pamięci: 26MB Oblicz pole wielokąta wypukłego. Wielokąt wypukły jest to wielokąt, który dla dowolnych jego dwóch punktów zawiera również odcinek
Bardziej szczegółowoAlgorytmy kombinatoryczne w bioinformatyce
lgorytmy kombinatoryczne w bioinformatyce wykład 4: dopasowanie sekwencj poszukiwanie motywów prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie
Bardziej szczegółowoAutomatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych
Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych autor: Robert Drab opiekun naukowy: dr inż. Paweł Rotter 1. Wstęp Zagadnienie generowania trójwymiarowego
Bardziej szczegółowoPrzyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Przyrównanie sekwencji Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych),
Bardziej szczegółowoPROCES TWORZENIA DOKUMENTU
PROCES TWORZENIA DOKUMENTU 1. PLANOWANIE 2. ANALIZA ASPEKTÓW PRAWNYCH I ETYCZNYCH 3. GROMADZENIE INFORMACJI 4. ORGANIZOWANIE (STRUKTURALIZOWANIE) INFORMACJI 5. TWORZENIE PLANU (STRUKTURY) DOKUMENTU 6.
Bardziej szczegółowo2 Kryptografia: algorytmy symetryczne
1 Kryptografia: wstęp Wyróżniamy algorytmy: Kodowanie i kompresja Streszczenie Wieczorowe Studia Licencjackie Wykład 14, 12.06.2007 symetryczne: ten sam klucz jest stosowany do szyfrowania i deszyfrowania;
Bardziej szczegółowoAlgorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Bardziej szczegółowoMatematyka dyskretna. Andrzej Łachwa, UJ, B/14
Matematyka dyskretna Andrzej Łachwa, UJ, 2019 andrzej.lachwa@uj.edu.pl 1B/14 Drogi w grafach Marszruta (trasa) w grafie G z wierzchołka w do wierzchołka u to skończony ciąg krawędzi w postaci. W skrócie
Bardziej szczegółowoHeurystyki. Strategie poszukiwań
Sztuczna inteligencja Heurystyki. Strategie poszukiwań Jacek Bartman Zakład Elektrotechniki i Informatyki Instytut Techniki Uniwersytet Rzeszowski DLACZEGO METODY PRZESZUKIWANIA? Sztuczna Inteligencja
Bardziej szczegółowoKonspekt do zajęć z przedmiotu Genetyka dla kierunku Położnictwo dr Anna Skorczyk-Werner Katedra i Zakład Genetyki Medycznej
Seminarium 1 część 1 Konspekt do zajęć z przedmiotu Genetyka dla kierunku Położnictwo dr Anna Skorczyk-Werner Katedra i Zakład Genetyki Medycznej Genom człowieka Genomem nazywamy całkowitą ilość DNA jaka
Bardziej szczegółowoPLAN WYKŁADU OPTYMALIZACJA GLOBALNA OPERATOR KRZYŻOWANIA ETAPY KRZYŻOWANIA
PLAN WYKŁADU Operator krzyżowania Operator mutacji Operator inwersji Sukcesja Przykłady symulacji AG Kodowanie - rodzaje OPTYMALIZACJA GLOBALNA Wykład 3 dr inż. Agnieszka Bołtuć OPERATOR KRZYŻOWANIA Wymiana
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS
PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS SEKWENCJONOWANIE GENOMÓW NEXT GENERATION METODA NOWEJ GENERACJI Sekwencjonowanie bardzo krótkich fragmentów 50-700 bp DNA unieruchomione na płytce Szybkie
Bardziej szczegółowoProgramowanie współbieżne Wykład 2. Iwona Kochańska
Programowanie współbieżne Wykład 2 Iwona Kochańska Miary skalowalności algorytmu równoległego Przyspieszenie Stały rozmiar danych N T(1) - czas obliczeń dla najlepszego algorytmu sekwencyjnego T(p) - czas
Bardziej szczegółowoAnalizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???
Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych??? Alfabet kwasów nukleinowych jest stosunkowo ubogi!!! Dla sekwencji DNA (RNA) stosuje się zasadniczo*
Bardziej szczegółowoMatematyka dyskretna
Matematyka dyskretna Wykład 13: Teoria Grafów Gniewomir Sarbicki Literatura R.J. Wilson Wprowadzenie do teorii grafów Definicja: Grafem (skończonym, nieskierowanym) G nazywamy parę zbiorów (V (G), E(G)),
Bardziej szczegółowoRównoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami
Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami dr inż. Mariusz Uchroński Wrocławskie Centrum Sieciowo-Superkomputerowe Agenda Cykliczny problem przepływowy
Bardziej szczegółowoDHPLC. Denaturing high performance liquid chromatography. Wiktoria Stańczyk Zofia Kołeczko
DHPLC Denaturing high performance liquid chromatography Wiktoria Stańczyk Zofia Kołeczko Mini-słowniczek SNP (Single Nucleotide Polymorphism) - zmienność sekwencji DNA; HET - analiza heterodupleksów; HPLC
Bardziej szczegółowoĆwiczenie 12. Diagnostyka molekularna. Poszukiwanie SNPs Odczytywanie danych z sekwencjonowania. Prof. dr hab. Roman Zieliński
Ćwiczenie 12 Diagnostyka molekularna. Poszukiwanie SNPs Odczytywanie danych z sekwencjonowania Prof. dr hab. Roman Zieliński 1. Diagnostyka molekularna 1.1. Pytania i zagadnienia 1.1.1. Jak definiujemy
Bardziej szczegółowoPORÓWNANIE NARZĘDZI DOSTĘPNYCH W OBSZARZE ROBOCZYM SZKICOWNIKA NX Z POLECENIAMI ZAWARTYMI W ANALOGICZNEJ PRZESTRZENI GEOMETRYCZNEJ CATIA V5
PORÓWNANIE NARZĘDZI DOSTĘPNYCH W OBSZARZE ROBOCZYM SZKICOWNIKA NX Z POLECENIAMI ZAWARTYMI W ANALOGICZNEJ PRZESTRZENI GEOMETRYCZNEJ CATIA V5 Tworzenie profili o charakterystycznym kształcie NARZĘDZIA, KTÓRE
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP
PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP WSTĘP 1. SNP 2. haplotyp 3. równowaga sprzężeń 4. zawartość bazy HapMap 5. przykłady zastosowań Copyright 2013, Joanna Szyda HAPMAP BAZA DANYCH HAPMAP - haplotypy
Bardziej szczegółowoMożliwości współczesnej inżynierii genetycznej w obszarze biotechnologii
Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii 1. Transgeneza - genetycznie zmodyfikowane oraganizmy 2. Medycyna i ochrona zdrowia 3. Genomika poznawanie genomów Przełom XX i
Bardziej szczegółowoAlgorytmy i str ruktury danych. Metody algorytmiczne. Bartman Jacek
Algorytmy i str ruktury danych Metody algorytmiczne Bartman Jacek jbartman@univ.rzeszow.pl Metody algorytmiczne - wprowadzenia Znamy strukturę algorytmów Trudność tkwi natomiast w podaniu metod służących
Bardziej szczegółowoMożliwości współczesnej inżynierii genetycznej w obszarze biotechnologii
Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii 1. Technologia rekombinowanego DNA jest podstawą uzyskiwania genetycznie zmodyfikowanych organizmów 2. Medycyna i ochrona zdrowia
Bardziej szczegółowoAUTOMATYZACJA PROCESÓW DYSKRETNYCH 2012 ALGORYTM SEKWENCJONOWANIA DNA PRZY UŻYCIU CHIPU BINAR- NEGO DLA WSZYSTKICH TYPÓW BŁEDÓW HYBRYDYZACJI
AUTOMATYZACJA PROCESÓW DYSKRETNYCH 2012 Marcin RADOM, Piotr FORMANOWICZ Politechnika Poznańska ALGORYTM SEKWENCJONOWANIA DNA PRZY UŻYCIU CHIPU BINAR- NEGO DLA WSZYSTKICH TYPÓW BŁEDÓW HYBRYDYZACJI Streszczenie.
Bardziej szczegółowoBioinformatyka. Program UGENE
Bioinformatyka Program UGENE www.michalbereta.pl UGENE jest darmowym programem do zadań bioinformatycznych. Można go pobrać ze strony http://ugene.net/. 1 1. Wczytanie rekordu z bazy ENA do programu UGENE
Bardziej szczegółowoPrzewidywanie miejsc wiązania nukleosomów w genomie drożdży
w genomie drożdży Aleksander Jankowski Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki 8 października 2009 Promotorzy: Jerzy Tiuryn Uniwersytet Warszawski Shyam Prabhakar Genome Institute
Bardziej szczegółowoOSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) Algorytmy i Struktury Danych PIŁA
OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) 16.01.2003 Algorytmy i Struktury Danych PIŁA ALGORYTMY ZACHŁANNE czas [ms] Porównanie Algorytmów Rozwiązyjących problem TSP 100 000 000 000,000 10 000 000
Bardziej szczegółowoPrzykładowe rozwiązania
Przykładowe rozwiązania Poniższy dokument zawiera przykładowe rozwiązania zadań z I etapu I edycji konkursu (2014 r.). Rozwiązania w formie takiej jak przedstawiona niżej uzyskałyby pełną liczbę punktów
Bardziej szczegółowoREPREZENTACJA LICZBY, BŁĘDY, ALGORYTMY W OBLICZENIACH
REPREZENTACJA LICZBY, BŁĘDY, ALGORYTMY W OBLICZENIACH Transport, studia niestacjonarne I stopnia, semestr I Instytut L-5, Wydział Inżynierii Lądowej, Politechnika Krakowska Adam Wosatko Ewa Pabisek Reprezentacja
Bardziej szczegółowoSCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO
SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO. Rzeczywistość (istniejąca lub projektowana).. Model fizyczny. 3. Model matematyczny (optymalizacyjny): a. Zmienne projektowania
Bardziej szczegółowoPorównanie czasów działania algorytmów sortowania przez wstawianie i scalanie
Więcej o sprawności algorytmów Porównanie czasów działania algorytmów sortowania przez wstawianie i scalanie Załóżmy, że możemy wykonać dane zadanie przy użyciu dwóch algorytmów: jednego o złożoności czasowej
Bardziej szczegółowoPrzygotowanie kilku wersji kodu zgodnie z wymogami wersji zadania,
Przetwarzanie równoległe PROJEKT OMP i CUDA Temat projektu dotyczy analizy efektywności przetwarzania równoległego realizowanego przy użyciu komputera równoległego z procesorem wielordzeniowym z pamięcią
Bardziej szczegółowo