Bioinformatyczne bazy danych - część 2. -przeszukiwanie baz danych -pobieranie danych

Podobne dokumenty
Bioinformatyczne bazy danych

Bioinformatyka. Michał Bereta

Bioinformatyka. Michał Bereta

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

Bioinformatyka. Program UGENE

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2)

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (1)

BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE. Podstawy Bioinformatyki wykład 4

BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE

Bioinformatyczne bazy danych

Bioinformatyczne bazy danych

Bioinformatyka. Rodzaje Mutacji

BIOLOGICZNE BAZY DANYCH SYLABUS

Bioinformatyka. Bazy danych. Wykład 3. E. Banachowicz. Wykład monograficzny Bioinformatyka. Wykład 3, Zakład Biofizyki Molekularnej IF UAM

Ćwiczenia nr 5. Wykorzystanie baz danych i narzędzi analitycznych dostępnych online

Ćwiczenie 12. Diagnostyka molekularna. Poszukiwanie SNPs Odczytywanie danych z sekwencjonowania. Prof. dr hab. Roman Zieliński

Podstawy bioinformatyki - biologiczne bazy danych

Kontakt.

Biologiczne bazy i modele danych

Bazy i modele danych

Biblioteka Wirtualnej Nauki

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE. Pracownia Informatyczna 2

BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

PODSTAWY BIOINFORMATYKI

Database resources of the National Center for Biotechnology Information. Magdalena Malczyk

Porównywanie i dopasowywanie sekwencji

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Bioinformatyka. z sylabusu...

Primo wyszukiwarka naukowa

Budowa kwasów nukleinowych

Entrez, wyszukiwarka dla nauk przyrodniczych: globalna kwerenda

Miejski System Zarządzania - Katowicka Infrastruktura Informacji Przestrzennej Pozwolenia wodnoprawne i zgłoszenia przydomowych oczyszczalni ścieków

Instrukcja korzystania z portalu Diagnoza Nowej Ery

Podstawy biologiczne - komórki. Podstawy biologiczne - cząsteczki. Model komórki eukariotycznej. Wprowadzenie do Informatyki Biomedycznej

OvidSP - Skrócony opis wyszukiwania - Wyszukiwanie proste i złożone,

Na komputerach z systemem Windows XP zdarzenia są rejestrowane w trzech następujących dziennikach: Dziennik aplikacji

Wyciągi. Lista operacji na wyciągu w postaci PDF

BUDOWA I FUNKCJA GENOMU LUDZKIEGO

Miejski System Zarządzania - Katowicka Infrastruktura Informacji Przestrzennej

Bioinformatyka. Wykład 2 (12.X.2010) I r. studiów magisterskich, biologia (SGGW) Krzysztof Pawłowski

DNA superhelikalny eukariota DNA kolisty bakterie plazmidy mitochondria DNA liniowy wirusy otrzymywany in vitro

1. System analizy danych NGS z paneli genów

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Politechnika Wrocławska. BIOINFORMATYKA i BIOLOGIA OBLICZENIOWA

MS Access - bazy danych

Logowanie, wyszukiwanie i zamawianie książek poprzez multiwyszukiwarkę PRIMO w Bibliotece Głównej WAT

Bazy danych i R/Bioconductor

INSTRUKCJA WYSZUKIWANIA

Utwórz strukturę bazy

CitiDirect BE Portal Eksport

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

Skrypt Bioinformatyka DRAFT Strona 67

I. Program II. Opis głównych funkcji programu... 19

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

CENTRALNA BIBLIOTEKA STATYSTYCZNA PRZEWODNIK PO KATALOGU KOMPUTEROWYM SYSTEM ALEPH WERSJA 22

Generator testów Bioinformatyka wer / 0 Strona: 1

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

Scenariusz zajęć WARSZTATY KOMPUTEROWE DLA NAUCZYCIELI. Autor: Maciej Lisak-Zbroński. 1. Grupa: Nauczyciele (uczący różnych przedmiotów)

Wykład 9: HUMAN GENOME PROJECT HUMAN GENOME PROJECT

I. Interfejs użytkownika.

Krótka instrukcja instalacji Adobe Acrobat Reader

EKSPLOATACJA SYSTEMÓW TECHNICZNYCH - LAB. Wprowadzenie do zajęć

Miejski System Zarządzania - Katowicka Infrastruktura Informacji Przestrzennej Formy ochrony przyrody oraz gospodarka zielenią

Politechnika Śląska. Wydział, Automatyki, Elektroniki i Informatyki

Lokalizacja genów DNA/RNA. Nukleotydy i ich łańcuchy 11/21/2013. Genom ludzki. Struktura genomu. Pirymidyny i Puryny

GENOMIKA. MAPOWANIE GENOMÓW MAPY GENOMICZNE

Generator testów Bioinformatyka_zdalne wer / 0 Strona: 1

Miejski System Zarządzania - Katowicka Infrastruktura Informacji Przestrzennej

Multiwyszukiwarka PRIMO dla KUL jak korzystać?

Przewodnik po serwisie INFORLEX.PL BIZNES

Wykonawca systemu: Dr inż. Andrzej Łysko

Konspekt do zajęć z przedmiotu Genetyka dla kierunku Położnictwo dr Anna Skorczyk-Werner Katedra i Zakład Genetyki Medycznej

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka

Archiwum DG 2016 PL-SOFT

ISBN

Zapytania do baz danych

Porównywanie i dopasowywanie sekwencji

Nawigacja po trasie wycieczki

WARUNKI ZALICZENIA PRZEDMIOTU- 5 ECTS

10/9/2013. Bioinformatyka i Biologia Obliczeniowa. BIOINFORMATYKA Co to jest i po co? Czym będziemy zajmować się na kursie: Tematyka wykładu

Kadry Optivum, Płace Optivum

EBSCOhost Wyszukiwanie podstawowe dla Bibliotek akademickich

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

KRAJOWA MAPA ZAGROŻEŃ BEZPIECZEŃSTWA INSTRUKCJA OBSŁUGI

INSTRUKCJA IMPORTOWANIA

Pamiętając o komplementarności zasad azotowych, dopisz sekwencję nukleotydów brakującej nici DNA. A C C G T G C C A A T C G A...

Sage Symfonia Sage Symfonia Start Wystawianie nieobsługiwanych w programach e-deklaracji i załączników do e-deklaracji

Sage Symfonia ERP Wystawianie nieobsługiwanych w programach e-deklaracji i załączników do e-deklaracji

Skrócona instrukcja. DriveConfigurator Konfigurator produktu firmy SEW-EURODRIVE

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

Propozycja standaryzacji usługi lokalizacji adresu

CZĘŚĆ III OPISPRZEDMIOTU ZAMÓWIENIA (OPZ)

System Wymiany Informacji. Instrukcja obsługi mapy

DWM-157. Modem USB HSPA+ Podręcznik użytkownika

Biblioteka Wirtualnej Nauki

WellCommerce Poradnik: Sprzedaż

Transkrypt:

Bioinformatyczne bazy danych - część 2 -przeszukiwanie baz danych -pobieranie danych

Numery dostępowe baz danych (accession number) to ciąg liter i cyfr służących jako etykieta identyfikująca sekwencję czy inny typ danych w bazie. Przykłady (wszystkie dotyczą białka wiążącego retinol RBP4 - retinol-binding protein): X02775 NG_009104 GenBank sekwencja genomowego DNA RefSeq DNA N91759.1 EST NM_006744 RefSeq sekwencja DNA (z transkryptu) X00129.1 mrna RNA AAC02945 Q28369 1KT7 PMID: 2998779 GenBank UniProtKB/SwissProt Protein Data Bank PubMed Białko Literatura

Sprawdź sekwencje o poniższych numerach dostępowych w sekwencyjnych bazach danych EMBL (ENA) i DDBJ: AF165912 L00727 NM_001017963 NC_012532.1 Zapoznaj się z opcją wyświetlania rekordu w formie graficznej EMBL / NCBI.

Entrez Gene Znajdź geny przez: Wolny tekst np. human muscular dystrophy Niekompletną (częściową) nazwę i podanie więcej niż jednego gatunku np. transporter[title] AND ("Homo sapiens"[orgn] OR "Mus musculus"[orgn]) Numer chromosomu i symbol np. (II[chr] OR 2[chr]) AND adh*[sym] Accession number np. M11313[accn] Nazwę genu (symbol) np. PRNP[sym] Publikację (PubMed ID) np. 11331580[PMID] Ontologie Genów (GO) np. retinol transporter activity"[go] Chromosom i gatunek np. X[CHR] AND human[orgn] Numery Enzyme Commission (EC) np. 5.1.1.1[EC]

Porady dotyczące korzystania z wyszukiwarki Entrez Operatory logiczne AND, OR i NOT powinny być zapisywane wielkimi literami. Domyślnie operator AND łączy dwa wprowadzone terminy. Operatory logiczne działają od lewej do prawej. Jeśli dodasz nawiasy, wprowadzony do nich termin będzie potraktowany jako jedna jednostka. Porównaj wynik wyszukiwania Entrez Gene poniższymi frazami: globin AND promoter OR enhancer globin AND (promoter OR enhancer) Zadania: 1. Gen dla ludzkiego białka lysine demethylase zlokalizowany jest na chromosomie Y. Utwórz zapytanie do bazy NCBI Gene, które da jeden wynik dla właściwego genu. 2. W bazie NCBI Taxonomy znajdź identyfikator dla E. coli K12. Wykorzystując identyfikator i kwalifikator [taxid] znajdź w bazie NCBI Gene rekord dla genu repb, kodującego białko replikacyjne.

Entrez Gene zadanie -Wyszukaj w bazie NCBI Gene ludzki gen BRCA1. -Podaj jego lokalizację chromosomową oraz liczbę eksonów. -Podaj długość genu, mrna i kodowanego białka wykorzystując dane z odpowiednich rekordów bazy RefSeq. -Sprawdź informacje dotyczące genu BRCA1 w bazie SNP (single nucleotide polymorphism). -Korzystając z odpowiednich filtrów wyszukiwania sprawdź ile SNPów ma charakter mutacji frame shift a ile powoduje pojawienie się kodonu STOP. OMIM / Entrez Gene Jaki gen związany jest ze śmiertelną bezsennością rodzinną (fatal familial insomnia FFI)? Podaj symbol tego genu, jego lokalizację chromosomową i liczbę eksonów. Jaki jest sposób dziedziczenia FFI? Z jakimi innymi chorobami związany jest ten gen? Sprawdź zmienność genu w bazie danych projektu 1000 genomów. Jakiego rodzaju zmiany w sekwencji genu są najmniej licznie reprezentowane?

Kwalifikatory wyszukiwania w Entrez Nucleotide (część bazy GenBank) Działa tylko w bazie Protein

Zadania: 1. Wyszukaj w bazie Nucleotide sekwencje o długości 1000 nt. Zawęź wyniki wyszukiwania do szympansa (użyj chimpanzee lub Pan troglodytes ) 2. Wyszukaj sekwencje nukleotydowe szczura w zakresie od 1500 do 2000 nukleotydów. 3. Znajdź sekwencje aminokwasowe białek krowy o ciężarze molekularnym od 5000 do 10000 Da. 4. Znajdź sekwencje aminokwasowe świni o długości 300 aminokwasów.

Narzędzie do zmiany formatu sekwencji Emboss Seqret http://www.ebi.ac.uk/tools/sfc/emboss_seqret/ 1. Wyszukaj w bazie GenBank sekwencję AF165912. Korzystając z opcji Send zapisz na komputerze plik z sekwencją w formacie GenBank (plik z rozszerzeniem.gb). Korzystając z narzędzia emboss seqret przekształć zapisaną sekwencję do formatu EMBL. 2. Wykorzystaj powyższe narzędzie do utworzenia pliku z sekwencją w formacie EMBL i GenBank z pliku w formacie.ab1 (ćwiczenie 2 sekwencja.ab1).

Pobieranie wielu sekwencji na podstawie ich numerów dostępowych Batchentrez https://www.ncbi.nlm.nih.gov/sites/batchentrez Znajdź w bazie Pubmed artykuł opisujący ewolucję molekularną białka OmpC bakterii z rodzaju Yersinia. Otwórz pełną wersję artykułu. Poszukaj sekcji Supplementary material i otwórz znajdujący się tam plik. Skopiuj wszystkie numery dostępowe sekwencji rozpoczynające się od KR dla gatunku Yersinia intermedia. Utwórz plik tekstowy z pobranymi numerami. Wykorzystaj utworzony plik do pobrania z bazy GenBank sekwencji w formacie FASTA. Inny sposób to wykorzystanie kwalifikatora [accn].

Przeglądarki Genomów NCBI MapViewer https://www.ncbi.nlm.nih.gov/mapview/ Najnowsza łatka (patch) https://www.ncbi.nlm.nih.gov/grc/human/data ENSEMBL http://www.ensembl.org USCS https://genome.ucsc.edu/ Porównaj statystyki dla najnowszych genomów referencyjnych człowieka między ENSEMBL a NCBI MapViewer.

NCBI MapViewer /OMIM / dbsnp / KEGG Przejdź na stronę MapViewer. Wybierz najnowszą wersję genomu referencyjnego dla człowieka. Otwórz mapę chromosomu nr 7. Jaka jest wielkość tego chromosomu? Ile genów zostało zidentyfikowanych na tym chromosomie? Znajdź region chromosomu 7 związany z mukowiscydozą (cystic fibrosis). Użyj filtru Gene. Z poziomu mapy chromosomu przejdź do bazy OMIM. Otwórz rekord dotyczący genu a następnie przeanalizuj trzy warianty alleliczne.0002,.0003,.0004 pod kątem rodzaju mutacji i wpływu na kodowane białko. Sprawdź rekordy bazy dbsnp odpowiadające poszczególnym wariantom. Z poziomu Entrez Gene przejdź do bazy KEGG i sprawdź rolę kodowanego białka w prawidłowym funkcjonowaniu trzustki.

NCBI MapViewer / Entrez Gene 1. Podaj symbole wszystkich genów zlokalizowanych z regionie 11p11.2 genomu człowieka. (skorzystaj z okna wyszukiwania: Region shown ) 2. Pobierz sekwencję genu ARSB kodującego sulfatazę arylową B wraz z regionem 500pz powyżej końca 5. 3. Korzystając z MapViewer znajdź gen kodujący huntingtinę. Mutacja w tym genie powoduje chorobę Huntingtona. Korzystając z Maps & Options wybierz do porównania mapy genowe człowieka, myszy i szczura. Podaj numery chromosomów myszy i szczura, na których zlokalizowane są homologi ludzkiego genu dla huntingtiny.