BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE

Podobne dokumenty
BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE. Podstawy Bioinformatyki wykład 4

BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE. Pracownia Informatyczna 2

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

Bioinformatyczne bazy danych - część 2. -przeszukiwanie baz danych -pobieranie danych

ADNOTACJE WARIANTÓW GENETYCZNYCH

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2)

Bazy danych i R/Bioconductor

CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1

Public gene expression data repositoris

Bioinformatyka. Michał Bereta

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (1)

Bioinformatyczne bazy danych

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

GENOMIKA. MAPOWANIE GENOMÓW MAPY GENOMICZNE

PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing. Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno

Bioinformatyka. Wykład 2 (12.X.2010) I r. studiów magisterskich, biologia (SGGW) Krzysztof Pawłowski

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Bioinformatyka. Michał Bereta

Bioinformatyczne bazy danych

1. KEGG 2. GO. 3. Klastry

Bioinformatyka, edycja 2016/2017, laboratorium

Przeglądarki genomowe

Podstawy bioinformatyki - biologiczne bazy danych

Budowa kwasów nukleinowych

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.

Glimmer umożliwia znalezienie regionów kodujących

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

Bioinformatyka. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2010/2011. Krzysztof Pawłowski

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka

Ćwiczenia nr 5. Wykorzystanie baz danych i narzędzi analitycznych dostępnych online

Kontakt.

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

Bioinformatyka. Krzysztof Pawłowski. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2012 / 2013

Bioinformatyczne bazy danych

Database resources of the National Center for Biotechnology Information. Magdalena Malczyk

Bazy danych i biologia

Pytania i odpowiedzi

Ekspresja genów. A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

POPULARNE POLECENIA SKRYPTY. Pracownia Informatyczna 2

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Bioinformatyka wykład I.2009

Różnorodność osobników gatunku

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Bioinformatyka. Bazy danych. Wykład 3. E. Banachowicz. Wykład monograficzny Bioinformatyka. Wykład 3, Zakład Biofizyki Molekularnej IF UAM

Podstawy bioinformatyki sekwencjonowanie nowej generacji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

Biologiczne bazy i modele danych

Bazy i modele danych

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Sekwencjonowanie, przewidywanie genów

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

PODSTAWY BIOINFORMATYKI

Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz

CZĘŚĆ III OPISPRZEDMIOTU ZAMÓWIENIA (OPZ)

Bioinformatyka. Rodzaje Mutacji

Wykład Bioinformatyka Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

Instrukcja migracji PREMIUM. Mendeley_Migration_Guide_Polish.indd 1

Wykład Bioinformatyka. Wykład 9. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Od jakiego pułapu startujemy? matematyka

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Pliki z Banku File Transfer Light

Nowoczesne systemy ekspresji genów

Politechnika Wrocławska. BIOINFORMATYKA i BIOLOGIA OBLICZENIOWA

Analiza sekwencji promotorów

Wyszukiwanie podobnych sekwencji w bazach danych. Wyszukiwanie w sekwencji nukleotydów czy aminokwasów? Czułość i selektywność

Strona 1 NUMPAGES INSTRUKCJA OBSŁUGI KARTY DARK. CENTRUM USŁUG ZAUFANIA SIGILLUM Wersja 1.0

PODSTAWY BIOINFORMATYKI WYKŁAD 2 SEKWENCJONOWANIE GENOMÓW

Samouczek: Konstruujemy drzewo

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

Hiperfenyloalaninemie

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

Systemy wbudowane. Poziomy abstrakcji projektowania systemów HW/SW. Wykład 9: SystemC modelowanie na różnych poziomach abstrakcji

Camspot 4.4 Camspot 4.5

ISBN

Mapowanie fizyczne genomów -konstrukcja map wyskalowanych w jednostkach fizycznych -najdokładniejszą mapą fizyczną genomu, o największej

Bioinformatyka 2 (BT172) Struktura i organizacja kursu

Motywacja. Do tej pory: Dzisiaj:

Podstawy bioinformatyki dla biotechnologów. plan. Od jakiego pułapu startujemy? Wykład 2. Definicja bioinformatyki

Metody analizy genomu

Searching for SNPs with cloud computing

Bioinformatyka. z sylabusu...

Bioinformatyka wykład 12, 18.I.2011 Białkowa bioinformatyka strukturalna c.d.

Politechnika Śląska. Wydział, Automatyki, Elektroniki i Informatyki

Twoje osobiste Obliczenie dla systemu ogrzewania i przygotowania c.w.u.

BUDOWA I FUNKCJA GENOMU LUDZKIEGO

Wrodzony przerost nadnerczy

Profilowanie somatyczne BRCA1, BRCA2

HARMONIZACJA DANYCH PRZESTRZENNYCH JERZY GAŹDZICKI

Temat: Definiowanie zadań, sekwencji i kamer w prezentacji programu Autodesk Inventor

"Zapisane w genach, czyli Python a tajemnice naszego genomu."

Strona 1 NUMPAGES INSTRUKCJA OBSŁUGI KARTY DARK. CENTRUM USŁUG ZAUFANIA SIGILLUM Wersja 1.1

Zasady rejestracji i instrukcja zarządzania kontem użytkownika portalu

Czynniki genetyczne sprzyjające rozwojowi otyłości

Transkrypt:

BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE Podstawy Bioinformatyki wykład 2 PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 1

GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 2

GENOMY I ICH ADNOTACJE NCBI PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 3

NCBI NCBI PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 4

NCBI REFERENCE SEQUENCE DATABASE NCBI RefSeq: kompleksowy, zintegrowany, niepowtarzalny dobrze opisany zestaw sekwencji referencyjnych genomy, transkrypty, białka baza niepowtarzalna (non-redundant) informacje sprawdzone (często weryfikowane manualnie) PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 5

NCBI REFERENCE SEQUENCE DATABASE NCBI RefSeq: kompleksowy, zintegrowany, niepowtarzalny dobrze opisany zestaw sekwencji referencyjnych genomy, transkrypty, białka baza niepowtarzalna (non-redundant) PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 6

NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 7

NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 8

NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 9

NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 10

NCBI REFERENCE SEQUENCE DATABASE Identyfikatory: NM_numer / XM_ numer NP_numer / XP_numer NR_ numer / XR_ numer NC_ numer, NG_ numer mrna białka niekodujące RNA kontigi, sekwencje genomowe N sekwencje uzyskane z wyników eksperymentów X sekwencje z adnotacji (sekwencja została przewidziana np. przez zmapowanie białka do genomu spokrewnionego organizmu) PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 11

NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 12

NCBI GENOME DATABASE PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 13

NCBI GENOME DATABASE PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 14

NCBI DOWNLOAD FTP (FILE TRANSFER PROTOCOL) PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 15

GENOMY I ICH ADNOTACJE NCBI Ensembl PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 16

ENSEMBL Przeglądarka genomów kręgowców Wspiera badania z zakresu genomiki porównawczej, ewolucji i regulacji ekspresji genów Dostępne narzędzia: BLAST, BLAT, BioMart, Variant Effect Predictor (VEP) PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 17

ENSEMBL Ensembl EnsemblGenomes EnsemblFungi EnsemblMetazoa EnsemblProtists EnsemblBacteria EnsemblPlants PreEnsembl PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 18

ENSEMBL Identyfikatory (Homo sapiens): ENSG Gene ENST Transcript ENSP Protein ENSE Exon Identyfikatory (inne gatunki): ENSFCAT00000032635 ENSRNOG00000050313 ENSCAFG00000022708 ENSBTAT00000064726 Felis catus Rattus norvegicus Canis lupus familiaris Bos taurus Zagadka: ENST00000471181.7?? ENSRNOT00000075759.1?? ENSSSCG00000018060?? PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 19

ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 20

PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 21

ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 22

ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 23

ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 24

Na którym chromosomie leży gen BRCA1? Ile ma form splicingowych? ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 25

Który transkrypt jest najdłuższy? ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 26

Który transkrypt jest najdłuższy? ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 27

ENSEMBL Downloads Download data via FTP PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 28

Downloads Download data via FTP ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 29

ENSEMBL Masked and unmasked genome sequences associated with the assembly (contigs, chromosomes etc.) Coordinate-system string: coord_system:version:name:start:end:strand PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 30

cdna sequences for Ensembl or ab initio predicted genes. ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 31

Non-coding RNA gene predictions. ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 32

Protein sequences for Ensembl or ab initio predicted genes. ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 33

ENSEMBL GTF Gene sets for each species. These files include annotations of both coding and non-coding genes. GFF3 provides access to all annotated transcripts which make up an Ensembl gene set. PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 34

GTF Gene sets for each species. These files include annotations of both coding and non-coding genes ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 35

GFF3 provides access to all annotated transcripts which make up an Ensembl gene set ENSEMBL PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 36

ENSEMBL TOOLS VEP Analyse your own variants and predict the functional consequences of known and unknown variants PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 37

VEP Analyse your own variants and predict the functional consequences of known and unknown variants VEP PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 38

VEP Analyse your own variants and predict the functional consequences of known and unknown variants VEP PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 39

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 40

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART Dataset: Ensembl genes Mouse strains Ensembl Variation Ensembl Regulation PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 41

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART Filters Atributes Count Results specifikacja przeszukiwań określenie formatowania danych wyjściowe dostępne rekordy o określonych parametrach wyniki, eksport plików PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 42

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 43

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 44

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 45

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 46

GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 47

UCSC PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 48

UCSC PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 49

PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 50

UCSC PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 51

UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Na którym chromosomie jest zlokalizowany? Jakiej długości jest sekwencja? PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 52

UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Ile ma wariantów splicingowych? Ile ma egzonów? PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 53

UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Gdzie ulega najwyższej ekspresji? PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 54

UCSC OPCJE WYŚWIETLANIA PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 55

UCSC PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 56

UCSC TABLE BROWSER Wszystkie znane geny z bazy UCSC dla myszy Chromosome 1 Format BED PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 57

UCSC TABLE BROWSER Wszystkie znane geny z bazy UCSC dla myszy Chromosome 1 Format BED PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 58

UCSC TABLE BROWSER Wszystkie znane geny z bazy UCSC dla myszy Chromosome 1 Format BED PODSTAWY BIOINFORMATYKI 2018/2019 MAGDA MIELCZAREK 59