BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE Podstawy Bioinformatyki wykład 4
GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 2
GENOMY I ICH ADNOTACJE NCBI PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 3
NCBI REFERENCE SEQUENCE DATABASE NCBI RefSeq: kompleksowy, zintegrowany, niepowtarzalny dobrze opisany zestaw sekwencji referencyjnych genomy, transkrypty, białka baza niepowtarzalna (non-redundant) informacje sprawdzone (często weryfikowane manualnie) PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 4
NCBI REFERENCE SEQUENCE DATABASE NCBI RefSeq: kompleksowy, zintegrowany, niepowtarzalny dobrze opisany zestaw sekwencji referencyjnych genomy, transkrypty, białka baza niepowtarzalna (non-redundant) PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 5
NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 6
NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 7
NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 8
NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 9
NCBI REFERENCE SEQUENCE DATABASE Identyfikatory: NM_numer / XM_ numer NP_numer / XP_numer NR_ numer / XR_ numer NC_ numer, NG_ numer mrna białka niekodujące RNA kontigi, sekwencje genomowe N sekwencje uzyskane z wyników eksperymentów X sekwencje z adnotacji (sekwencja została przewidziana np. przez zmapowanie białka do genomu spokrewnionego organizmu) PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 10
NCBI REFERENCE SEQUENCE DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 11
NCBI GENOME DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 12
NCBI GENOME DATABASE PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 13
NCBI DOWNLOAD FTP (FILE TRANSFER PROTOCOL) PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 14
GENOMY I ICH ADNOTACJE NCBI Ensembl PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 15
ENSEMBL Przeglądarka genomów kręgowców Wspiera badania z zakresu genomiki porównawczej, ewolucji i regulacji ekspresji genów Dostępne narzędzia: BLAST, BLAT, BioMart, Variant Effect Predictor (VEP) PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 16
ENSEMBL Ensembl EnsemblGenomes EnsemblFungi EnsemblMetazoa EnsemblProtists EnsemblBacteria EnsemblPlants PreEnsembl PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 17
ENSEMBL Identyfikatory (Homo sapiens): ENSG Gene ENST Transcript ENSP Protein ENSE Exon Identyfikatory (inne gatunki): ENSFCAT00000032635 ENSRNOG00000050313 ENSCAFG00000022708 ENSBTAT00000064726 Felis catus Rattus norvegicus Canis lupus familiaris Bos taurus Zagadka: ENST00000471181.7?? ENSRNOT00000075759.1?? ENSSSCG00000018060?? PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 18
ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 19
ANALIZA DANYCH NGS 2017/2018 MAGDA MIELCZAREK 20
ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 21
ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 22
ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 23
Na którym chromosomie leży gen BRCA1? Ile ma form splicingowych? ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 24
Który transkrypt jest najdłuższy? ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 25
Który transkrypt jest najdłuższy? ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 26
Downloads Download data via FTP ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 27
Downloads Download data via FTP ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 28
ENSEMBL Masked and unmasked genome sequences associated with the assembly (contigs, chromosomes etc.) Coordinate-system string: coord_system:version:name:start:end:strand PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 29
cdna sequences for Ensembl or ab initio predicted genes. ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 30
Non-coding RNA gene predictions. ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 31
Protein sequences for Ensembl or ab initio predicted genes. ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 32
ENSEMBL GTF Gene sets for each species. These files include annotations of both coding and non-coding genes. GFF3 provides access to all annotated transcripts which make up an Ensembl gene set. PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 33
GTF Gene sets for each species. These files include annotations of both coding and non-coding genes ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 34
GFF3 provides access to all annotated transcripts which make up an Ensembl gene set ENSEMBL PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 35
ENSEMBL TOOLS VEP Analyse your own variants and predict the functional consequences of known and unknown variants PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 36
VEP Analyse your own variants and predict the functional consequences of known and unknown variants VEP PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 37
VEP Analyse your own variants and predict the functional consequences of known and unknown variants VEP PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 38
BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 39
BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART Dataset: Ensembl genes Mouse strains Ensembl Variation Ensembl Regulation PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 40
BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART Filters Atributes Count Results specifikacja przeszukiwań określenie formatowania danych wyjściowe dostępne rekordy o określonych parametrach wyniki, eksport plików PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 41
BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 42
BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 43
BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 44
BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 45
GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 46
UCSC PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 47
UCSC PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 48
PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 49
UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Na którym chromosomie jest zlokalizowany? Jakiej długości jest sekwencja? PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 50
UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Ile ma wariantów splicingowych? Ile ma egzonów? PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 51
UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Czy zawiera elementy powtarzalne? Ile w danym regionie zaobserwowano SNP? PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 52
UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Gdzie ulega najwyższej ekspresji? PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 53
UCSC OPCJE WYŚWIETLANIA PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 54
UCSC PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 55
UCSC TABLE BROWSER Wszystkie znane geny z bazy UCSC dla myszy Chromosome 1 Format BED PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 56
UCSC TABLE BROWSER Wszystkie znane geny z bazy UCSC dla myszy Chromosome 1 Format BED PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 57
UCSC TABLE BROWSER Wszystkie znane geny z bazy UCSC dla myszy Chromosome 1 Format BED PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 58