BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE. Pracownia Informatyczna 2

Podobne dokumenty
BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE

BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE. Podstawy Bioinformatyki wykład 4

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (1)

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2)

Podstawy bioinformatyki - biologiczne bazy danych

BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH

Bioinformatyczne bazy danych - część 2. -przeszukiwanie baz danych -pobieranie danych

Bioinformatyka. Michał Bereta

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

ADNOTACJE WARIANTÓW GENETYCZNYCH

Bioinformatyka. Michał Bereta

Bioinformatyczne bazy danych

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

Bioinformatyczne bazy danych

Bioinformatyka. Wykład 2 (12.X.2010) I r. studiów magisterskich, biologia (SGGW) Krzysztof Pawłowski

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing. Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno

Database resources of the National Center for Biotechnology Information. Magdalena Malczyk

1. KEGG 2. GO. 3. Klastry

Przeglądarki genomowe

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

Bazy danych i R/Bioconductor

PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS

Ćwiczenia nr 5. Wykorzystanie baz danych i narzędzi analitycznych dostępnych online

CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1

Bioinformatyczne bazy danych

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.

Kontakt.

Bazy i modele danych

Biologiczne bazy i modele danych

GENOMIKA. MAPOWANIE GENOMÓW MAPY GENOMICZNE

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

PODSTAWY BIOINFORMATYKI

Budowa kwasów nukleinowych

Public gene expression data repositoris

Bioinformatyka. Bazy danych. Wykład 3. E. Banachowicz. Wykład monograficzny Bioinformatyka. Wykład 3, Zakład Biofizyki Molekularnej IF UAM

Bazy danych i biologia

Historia Bioinformatyki

Bioinformatyka. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2010/2011. Krzysztof Pawłowski

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka

Glimmer umożliwia znalezienie regionów kodujących

Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

CZĘŚĆ III OPISPRZEDMIOTU ZAMÓWIENIA (OPZ)

Od jakiego pułapu startujemy? matematyka

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

Politechnika Wrocławska. BIOINFORMATYKA i BIOLOGIA OBLICZENIOWA

Sekwencjonowanie, przewidywanie genów

Bioinformatyka. z sylabusu...

Ekspresja genów. A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

Samouczek: Konstruujemy drzewo

Bioinformatyka. Krzysztof Pawłowski. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2012 / 2013

ISBN

Bioinformatyka, edycja 2016/2017, laboratorium

Podstawy bioinformatyki dla biotechnologów. plan. Od jakiego pułapu startujemy? Wykład 2. Definicja bioinformatyki

Pytania i odpowiedzi

Bioinformatyka wykład I.2009

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

PODSTAWY BIOINFORMATYKI WYKŁAD 2 SEKWENCJONOWANIE GENOMÓW

Bioinformatyka. Rodzaje Mutacji

Bioinformatyka 2 (BT172) Struktura i organizacja kursu

Nowoczesne systemy ekspresji genów

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

Bioinformatyka Laboratorium, 30h. Michał Bereta

Motywacja. Do tej pory: Dzisiaj:

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Różnorodność osobników gatunku

10/9/2013. Bioinformatyka i Biologia Obliczeniowa. BIOINFORMATYKA Co to jest i po co? Czym będziemy zajmować się na kursie: Tematyka wykładu

BIOLOGICZNE BAZY DANYCH SYLABUS

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

Wykład Bioinformatyka Bioinformatyka. Wykład 7. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM. Ewolucyjne podstawy Bioinformatyki

Zasady rejestracji i instrukcja zarządzania kontem użytkownika portalu

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing

WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Bioinformatyka. Michał Przyłuski

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA

Hiperfenyloalaninemie

Techniki biologii molekularnej Kod przedmiotu

POPULARNE POLECENIA SKRYPTY. Pracownia Informatyczna 2

Analiza danych pochodzących z sekwencjonowania nowej generacji - przyrównanie do genomu referencyjnego. - część I -

Politechnika Śląska. Wydział, Automatyki, Elektroniki i Informatyki

Podstawy bioinformatyki sekwencjonowanie nowej generacji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Jajko czy kura? czyli gdzie dwóch się bije, tam trzeci korzysta

Podstawy biologiczne - komórki. Podstawy biologiczne - cząsteczki. Model komórki eukariotycznej. Wprowadzenie do Informatyki Biomedycznej

Systemy wbudowane. Poziomy abstrakcji projektowania systemów HW/SW. Wykład 9: SystemC modelowanie na różnych poziomach abstrakcji

Genetyka i biologia eksperymentalna studia I stopnia 2017/18/19/20

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing

TERAPIA GENOWA. dr Marta Żebrowska

Wrodzony przerost nadnerczy

Wprowadzenie do bioinformatyki

SYLABUS. Wydział Biologiczno-Rolniczy. Katedra Biochemii i Biologii Komórki

Profilowanie somatyczne BRCA1, BRCA2

1. System analizy danych NGS z paneli genów

Instrukcja migracji PREMIUM. Mendeley_Migration_Guide_Polish.indd 1

Transkrypt:

BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE Pracownia Informatyczna 2

WYBRANE BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC

NATIONAL CENTER FOR BIOTECHNOLOGY INFORMATION NCBI Utworzone w 1988 Dziedziny nauki: biologia molekularna, biochemia, genetyka Zadania Przechowywanie bazy danych Analiza danych oprogramowanie Udostępnianie baz danych i oprogramowania do badań naukowych Koordynacja gromadzenia danych na poziomie międzynarodowym

NCBI www.ncbi.nlm.nih.gov/sites/gquery

NCBI REFERENCE SEQUENCE DATABASE (REFSEQ) Identyfikatory: NM_numer / XM_ numer NP_numer / XP_numer NR_ numer / XR_ numer NC_ numer, NG_ numer mrna białka niekodujące RNA kontigi, sekwencje genomowe N sekwencje uzyskane z wyników eksperymentów X sekwencje z adnotacji (sekwencja została przewidziana np. przez zmapowanie białka do genomu spokrewnionego organizmu)

NCBI ASSEMBLY & GENOME DATBASES Assembly: A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data. Genome: This resource organizes information on genomes including sequences, maps, chromosomes, assemblies, and annotations.

www.ncbi.nlm.nih.gov/sites/entrez?db=genome www.ncbi.nlm.nih.gov/genome/browse/ Copyright 2017, J. Szyda & M. Mielczarek

NCBI ASSEMBLY & GENOME DATABASES

NCBI GENOME DATABASE

NCBI DOWNLOAD FTP (FILE TRANSFER PROTOCOL)

software.broadinstitute.org/software/igv/home FORMATY DANYCH Czym jest format danych? Po co zapisywać dane w konkretnym formacie? Przykłady: FASTA, FASTQ, GenBank, Newick, SAM, VCF, BED i inne

FASTA Prosty i popularny czytelny dla wielu programów do analizy bioinformatycznej Zapis sekwencji kwasów nukleinowych oraz białek Identyfikator sekwencji opis >gi 52693750 dbj AB175071.1 Neomys fodiens mitochondrial cytb gene for cytochrome b, complete cds ATGACCAACTTTCGAAAAACCCATCCATTAATAAAAATTCTTAACAACTCATTCATCGAC CATCAAACATTTCATCATGATGAAATTTCGGGTCCCTTCTAGGATTGTGCCTAGTAATC

GENOMY I ICH ADNOTACJE NCBI Ensembl

ENSEMBL Przeglądarka genomów kręgowców Wspiera badania z zakresu genomiki porównawczej, ewolucji i regulacji ekspresji genów Dostępne narzędzia: BLAST, BLAT, BioMart, Variant Effect Predictor (VEP)

ENSEMBL Ensembl EnsemblGenomes EnsemblFungi EnsemblMetazoa EnsemblProtists EnsemblBacteria EnsemblPlants PreEnsembl

ENSEMBL Identyfikatory (Homo sapiens): ENSG Gene ENST Transcript ENSP Protein ENSE Exon Identyfikatory (inne gatunki): ENSFCAT00000032635 ENSRNOG00000050313 ENSCAFG00000022708 ENSBTAT00000064726 Felis catus Rattus norvegicus Canis lupus familiaris Bos taurus Zagadka: ENST00000471181.7?? ENSRNOT00000075759.1?? ENSSSCG00000018060??

ENSEMBL

ENSEMBL

ENSEMBL

ENSEMBL

Na którym chromosomie leży gen BRCA1? Ile ma form splicingowych? ENSEMBL

Który transkrypt jest najdłuższy? ENSEMBL

Który transkrypt jest najdłuższy? ENSEMBL

Downloads Download data via FTP ENSEMBL

Downloads Download data via FTP ENSEMBL

ENSEMBL Masked and unmasked genome sequences associated with the assembly (contigs, chromosomes etc.) Coordinate-system string: coord_system:version:name:start:end:strand

cdna sequences for Ensembl or ab initio predicted genes. ENSEMBL

Coding sequences for Ensembl or ab initio predicted genes. ENSEMBL

Non-coding RNA gene predictions. ENSEMBL

Protein sequences for Ensembl or ab initio predicted genes. ENSEMBL

ENSEMBL More extensive sequence annotation by means of feature tables and contain thus the genome sequence as annotated by the automated Ensembl genome annotation pipeline. Each nucleotide sequence record in a flat file represents a 1Mb slice of the genome sequence.

ENSEMBL GTF Gene sets for each species. These files include annotations of both coding and non-coding genes. GFF3 provides access to all annotated transcripts which make up an Ensembl gene set.

GTF Gene sets for each species. These files include annotations of both coding and non-coding genes ENSEMBL

GFF3 provides access to all annotated transcripts which make up an Ensembl gene set ENSEMBL

ENSEMBL TOOLS VEP Analyse your own variants and predict the functional consequences of known and unknown variants

VEP Analyse your own variants and predict the functional consequences of known and unknown variants VEP

VEP Analyse your own variants and predict the functional consequences of known and unknown variants VEP

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART Dataset: Ensembl genes Mouse strains Ensembl Variation Ensembl Regulation

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART Filters Atributes Count Results specifikacja przeszukiwań określenie formatowania danych wyjściowe dostępne rekordy o określonych parametrach wyniki, eksport plików

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART

BioMart Export custom datasets from Ensembl with this data-mining tool BIOMART

GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC

UCSC

UCSC

UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Na którym chromosomie jest zlokalizowany? Jakiej długości jest sekwencja?

UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Ile ma wariantów splicingowych? Ile ma egzonów?

UCSC GEN PAH Gen PAH (enzym hydroksylazy fenyloalaninowej) Gdzie ulega najwyższej ekspresji?

UCSC

UCSC TABLE BROWSER Wszystkie znane geny z bazy UCSC dla myszy Chromosome 1 Format BED

UCSC TABLE BROWSER Wszystkie znane geny z bazy UCSC dla myszy Chromosome 1 Format BED

UCSC TABLE BROWSER Wszystkie znane geny z bazy UCSC dla myszy Chromosome 1 Format BED