BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE. Podstawy Bioinformatyki wykład 4

Podobne dokumenty
BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE

BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE. Pracownia Informatyczna 2

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

Bioinformatyczne bazy danych - część 2. -przeszukiwanie baz danych -pobieranie danych

ADNOTACJE WARIANTÓW GENETYCZNYCH

CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2)

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (1)

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing. Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno

GENOMIKA. MAPOWANIE GENOMÓW MAPY GENOMICZNE

Bazy danych i R/Bioconductor

Public gene expression data repositoris

Bioinformatyka. Michał Bereta

Bioinformatyczne bazy danych

Przeglądarki genomowe

Bioinformatyka. Wykład 2 (12.X.2010) I r. studiów magisterskich, biologia (SGGW) Krzysztof Pawłowski

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Bioinformatyka. Michał Bereta

Bioinformatyka, edycja 2016/2017, laboratorium

Bioinformatyczne bazy danych

Podstawy bioinformatyki - biologiczne bazy danych

1. KEGG 2. GO. 3. Klastry

Glimmer umożliwia znalezienie regionów kodujących

BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH

Budowa kwasów nukleinowych

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.

Ćwiczenia nr 5. Wykorzystanie baz danych i narzędzi analitycznych dostępnych online

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

Bioinformatyczne bazy danych

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

Podstawy bioinformatyki sekwencjonowanie nowej generacji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Bioinformatyka. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2010/2011. Krzysztof Pawłowski

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka

Kontakt.

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

Bioinformatyka. Krzysztof Pawłowski. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2012 / 2013

Database resources of the National Center for Biotechnology Information. Magdalena Malczyk

Różnorodność osobników gatunku

Bazy danych i biologia

Pytania i odpowiedzi

Ekspresja genów. A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

POPULARNE POLECENIA SKRYPTY. Pracownia Informatyczna 2

PODSTAWY BIOINFORMATYKI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Bioinformatyka wykład I.2009

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz

Bioinformatyka. Bazy danych. Wykład 3. E. Banachowicz. Wykład monograficzny Bioinformatyka. Wykład 3, Zakład Biofizyki Molekularnej IF UAM

PODSTAWY BIOINFORMATYKI WYKŁAD 2 SEKWENCJONOWANIE GENOMÓW

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

Biologiczne bazy i modele danych

Bazy i modele danych

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Sekwencjonowanie, przewidywanie genów

CZĘŚĆ III OPISPRZEDMIOTU ZAMÓWIENIA (OPZ)

Bioinformatyka. Rodzaje Mutacji

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

Wykład Bioinformatyka Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

Instrukcja migracji PREMIUM. Mendeley_Migration_Guide_Polish.indd 1

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Wykład Bioinformatyka. Wykład 9. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

PODSTAWY BIOINFORMATYKI 3 SEKWENCJONOWANIE GENOMÓW I

PODSTAWY BIOINFORMATYKI ORGANIZACJA ZAJĘĆ BIOINFORMATYKA PRZETWARZANIE I ANALIZA DANYCH

Hiperfenyloalaninemie

Od jakiego pułapu startujemy? matematyka

PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP

Searching for SNPs with cloud computing

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Mapowanie fizyczne genomów -konstrukcja map wyskalowanych w jednostkach fizycznych -najdokładniejszą mapą fizyczną genomu, o największej

"Zapisane w genach, czyli Python a tajemnice naszego genomu."

Pliki z Banku File Transfer Light

Nowoczesne systemy ekspresji genów

Politechnika Wrocławska. BIOINFORMATYKA i BIOLOGIA OBLICZENIOWA

Wrodzony przerost nadnerczy

Bioinformatyczna analiza danych. Wykład 1 Dr Wioleta Drobik-Czwarno Katedra Genetyki i Ogólnej Hodowli Zwierząt

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

Profilowanie somatyczne BRCA1, BRCA2

Analiza sekwencji promotorów

Ekologia molekularna. wykład 11

Wyszukiwanie podobnych sekwencji w bazach danych. Wyszukiwanie w sekwencji nukleotydów czy aminokwasów? Czułość i selektywność

Strona 1 NUMPAGES INSTRUKCJA OBSŁUGI KARTY DARK. CENTRUM USŁUG ZAUFANIA SIGILLUM Wersja 1.0

Samouczek: Konstruujemy drzewo

Historia Bioinformatyki

Przytarczyce, zaburzenia metabolizmu wapnia

Systemy wbudowane. Poziomy abstrakcji projektowania systemów HW/SW. Wykład 9: SystemC modelowanie na różnych poziomach abstrakcji

Camspot 4.4 Camspot 4.5

Bazy danych czynników biologicznych i ich wykorzystanie w identyfikacji zagrożenia biologicznego.

ISBN

Acrodermatitis enteropathica

Bioinformatyka 2 (BT172) Struktura i organizacja kursu

Motywacja. Do tej pory: Dzisiaj:

Rak płuc. Gen Choroba/objawy Sposób dziedziczenia. CDKN2A Czerniak, Rak trzustki, Rak płuca, Zespół predyspozycji do nowotworów AD 26

Transkryptomika porównawcza wybranych gatunków zwierząt morskich mgr Magdalena Małachowicz

Transkrypt:

BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE Podstawy Bioinformatyki wykład 4

GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 2

GENOMY I ICH ADNOTACJE NCBI PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 3

NCBI REFERENCE SEQUENCE DATABASE NCBI RefSeq: kompleksowy, zintegrowany, niepowtarzalny dobrze opisany zestaw sekwencji referencyjnych genomy, transkrypty, białka baza niepowtarzalna (non-redundant) informacje sprawdzone (często weryfikowane manualnie) PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 4

NCBI REFERENCE SEQUENCE DATABASE NCBI RefSeq: kompleksowy, zintegrowany, niepowtarzalny dobrze opisany zestaw sekwencji referencyjnych genomy, transkrypty, białka baza niepowtarzalna (non-redundant) PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 5

NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 6

NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 7

NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 8

NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 9

NCBI REFERENCE SEQUENCE DATABASE Identyfikatory: NM_numer / XM_ numer NP_numer / XP_numer NR_ numer / XR_ numer NC_ numer, NG_ numer mrna białka niekodujące RNA kontigi, sekwencje genomowe N sekwencje uzyskane z wyników eksperymentów X sekwencje z adnotacji (sekwencja została przewidziana np. przez zmapowanie białka do genomu spokrewnionego organizmu) PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 10

NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 11

NCBI GENOME DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 12

NCBI GENOME DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 13

NCBI DOWNLOAD FTP (FILE TRANSFER PROTOCOL) PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 14

GENOMY I ICH ADNOTACJE NCBI Ensembl PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 15

ENSEMBL Przeglądarka genomów kręgowców Wspiera badania z zakresu genomiki porównawczej, ewolucji i regulacji ekspresji genów Dostępne narzędzia: BLAST, BLAT, BioMart, Variant Effect Predictor (VEP) PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 16

ENSEMBL Ensembl EnsemblGenomes EnsemblFungi EnsemblMetazoa EnsemblProtists EnsemblBacteria EnsemblPlants PreEnsembl PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 17

ENSEMBL Identyfikatory (Homo sapiens): ENSG Gene ENST Transcript ENSP Protein ENSE Exon Identyfikatory (inne gatunki): ENSFCAT00000032635 ENSRNOG00000050313 ENSCAFG00000022708 ENSBTAT00000064726 Felis catus Rattus norvegicus Canis lupus familiaris Bos taurus Zagadka: ENST00000471181.7?? ENSRNOT00000075759.1?? ENSSSCG00000018060?? PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 18

ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 19

ANALIZA DANYCH NGS 2017/2018 MAGDA MIELCZAREK 20

ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 21

ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 22

ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 23

Na którym chromosomie leży gen BRCA1? Ile ma form splicingowych? ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 24

Który transkrypt jest najdłuższy? ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 25

Który transkrypt jest najdłuższy? ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 26

Downloads Download data via FTP ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 27

Downloads Download data via FTP ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 28

ENSEMBL Masked and unmasked genome sequences associated with the assembly (contigs, chromosomes etc.) Coordinate-system string: coord_system:version:name:start:end:strand PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 29

cdna sequences for Ensembl or ab initio predicted genes. ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 30

Non-coding RNA gene predictions. ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 31

Protein sequences for Ensembl or ab initio predicted genes. ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 32

ENSEMBL GTF Gene sets for each species. These files include annotations of both coding and non-coding genes. GFF3 provides access to all annotated transcripts which make up an Ensembl gene set. PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 33

GTF Gene sets for each species. These files include annotations of both coding and non-coding genes ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 34

GFF3 provides access to all annotated transcripts which make up an Ensembl gene set ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 35

ENSEMBL TOOLS VEP Analyse your own variants and predict the functional consequences of known and unknown variants PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 36

VEP Analyse your own variants and predict the functional consequences of known and unknown variants VEP PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 37

VEP Analyse your own variants and predict the functional consequences of known and unknown variants VEP PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 38

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 39

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART Dataset: Ensembl genes Mouse strains Ensembl Variation Ensembl Regulation PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 40

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART Filters Atributes Count Results specifikacja przeszukiwań określenie formatowania danych wyjściowe dostępne rekordy o określonych parametrach wyniki, eksport plików PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 41

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 42

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 43

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 44

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 45

GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 46

UCSC PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 47

UCSC PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 48

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 49

UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Na którym chromosomie jest zlokalizowany? Jakiej długości jest sekwencja? PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 50

UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Ile ma wariantów splicingowych? Ile ma egzonów? PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 51

UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Czy zawiera elementy powtarzalne? Ile w danym regionie zaobserwowano SNP? PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 52

UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Gdzie ulega najwyższej ekspresji? PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 53

UCSC OPCJE WYŚWIETLANIA PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 54

UCSC PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 55

UCSC TABLE BROWSER Wszystkie znane geny z bazy UCSC dla myszy Chromosome 1 Format BED PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 56

UCSC TABLE BROWSER Wszystkie znane geny z bazy UCSC dla myszy Chromosome 1 Format BED PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 57

UCSC TABLE BROWSER Wszystkie znane geny z bazy UCSC dla myszy Chromosome 1 Format BED PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 58