Przeglądarki genomowe
Popularne typy danych w nowoczesnych naukach biologicznych obejmują: sekwencje genomu sekwencje transkryptomu sekwencje proteomu epigenom adnotacje: geny, eksony, introny, izoformy, niekodujące RNA, elementy transpozonowe, miejsca wiązania czynników transkrypcyjnych zależności i interakcje, mapy i ścieżki metaboliczne Dane z indywidualnych eksperymentów (najczęściej tzw. surowe dane): dane z wysokoprzepustowego sekwencjonowania dane SNP dane CNV dane indel dane z mapowania i przyrównania sekwencji
Aby je przeanalizowad potrzebujemy nie tylko odpowiednich narzędzi do obróbki danych, ale też (a może przede wszystkim) wizualizacji w odpowiednim kontekście. Do tego celu służą przeglądarki genomowe.
Dostępne opcje: publiczne przeglądarki genomowe dla popularnych organizmów i danych nałożenie własnych danych na dane w publicznej przeglądarce zainstalowanie lokalnej przeglądarki genomowej do wizualizacji własnych danych powiązanie własnej bazy danych z odpowiednio skonfigurowaną przeglądarką
Przegląd darmowych przeglądarek genomowych umożliwiających wizualizację i adnotację sekwencji, danych NGS (czasem też mikromacierzy), wyników analiz sekwencji
Integrative Genomics Viewer (IGV) Integrated Genome Browser (IGB) JBrowse* GBrowse* NCBI Genome Workbench EagleView Apollo/WebApollo* Artemis Tablet Savant Genome Browser
Integrated Genome Browser (IGB) adres: http://bioviz.org/igb/index.html dostawca: Pierwotnie rozwijana przez Affymetrix (od 2003 roku). Obecnie UNC Charlotte (The University of North Carolina at Charlotte) dostęp: otwarty typ: niezależna aplikacja wspierane systemy operacyjne: Windows, Mac, Unix kod źródłowy: dostępny eksport danych do innych programów: tak eksport obrazków: tak personalizacja widoku: tak zoom: semantic zoom manual: wiki
Integrated Genome Browser (IGB) polecane zastosowania: wizualizacja danych RNA-Seq i ChipSeq (e.g. pliki wyjściowe programów TopHat, Bowtie) w kontekście genomowym; wizualizacja wyników z tiling array, analiza alternatywnego splicingu, SNP przyjmowane dane z: lokalnych plików, serwerów IGBQuickLoad, IGBQuickLoad DAS, the UCSC DAS, Ensembl DAS, adresów URL genom: wbudowany lub z własnych plików przyjmowane formaty plików: BAM, SAM (dane NGS), wiggle, bar, gr, sgr, (dane tiling array), GenBank, fasta https://wiki.transvar.org/display/igbman/file+formats wymiana / udostępnianie własnych danych: poprzez IGBQuickLoad w trybie prywatnym lub ogólnodostępnym inne cechy: przenośne grafy ułatwiają porównywanie różnych ścieżek danych oznaczanie granic zaznaczonych elementów w poprzek ścieżek - ułatwiają porównywanie różnych ścieżek danych zwężanie intronów (Sliced View) obsługa zapytao HTTP możliwośd obsługi w trybie komend, dająca możliwośd pisania prostych skryptów
Nicol JW, Helt GA, Blanchard SG Jr, Raja A, Loraine AE. The Integrated Genome Browser: free software for distribution and exploration of genome-scale datasets. Bioinformatics. 2009 Oct 15;25(20):2730-1. Epub 2009 Aug 4. PubMed PMID: 19654113; PubMed Central PMCID: PMC2759552. http://www.ncbi.nlm.nih.gov/pmc/articles/pmc2759552
Integrative Genome Browser (IGV) Utworzona i dostarczana przez Broad Institute Darmowa Kompletna przeglądarka Może byd zainstalowana jako niezależna aplikacja Bardzo wszechstronna i dynamiczna Utworzona w Java Rozpoznaje wiele formatów plików Łatwa w obsłudze Daje możliwośd automatyzacji i powiązania z innymi programami
Generic Genome Browser (GBrowse) adres: http://www.gbrowse.org/ dostawca: Copyright (c) 2002 Cold Spring Harbor Laboratory and University of California, Berkeley; Copyright (c) 2010 Ontario Institute for Cancer Research; element projektu Generic Model Organism Systems Database (GMOD dostęp: otwarty typ: połączenie bazy danych i przeglądarki wspierane systemy operacyjne: Linux (ostatnia wersja 2012) kod źródłowy: dostępny eksport danych do innych programów: tak eksport obrazków: tak personalizacja widoku: tak instalacja: skomplikowana, wymaga bibliotek Perl manual: wiki
Generic Genome Browser (GBrowse) inne cechy: zoom nieciągły, kilka skali jednocześnie, opcje scroll, zoom, center katalog dostępnych oznakowao (glyphs) możliwośd personalizacji wyszukiwanie wg ID, słów kluczowych, koordynatach genomowych możliwośd dodania własnych adnotacji ustawienia zachowane między sesjami zrzuty sekwencji DNA możliwośd powiązania z różnymi bazami danych, Chado, MySQL możliwośd dodania różnorodnych wtyczek (e.g. run BLAST, eksport, import różnych formatów, edycja obiektów, znajdowanie starterów, miejsc restrykcyjnych etc. możliwośd współdzielenia plików Wykorzystywana w Wormbase, Flybase, TAIR
JBrowse adres: http://jbrowse.org/ dostawca: University of California, Berkeley, od 2008 roku, element projektu Generic Model Organism Systems Database (GMOD dostęp: otwarty typ: połączenie bazy danych i przeglądarki wspierane systemy operacyjne: Linux (ostatnia wersja 2012) kod źródłowy: dostępny eksport danych do innych programów: tak eksport obrazków: tak personalizacja widoku: tak instalacja: dośd skomplikowana, przeglądarka oparta na Java i HTML5 manual: wiki Wykorzystywana w Tomato re-sequencing project, Genomes unzipped
Apollo i WebApollo Wersja typu desktop nie wspierana od 2013 roku. Obecnie rozwijana WebApollo, wersja oparta o przeglądarki internetowe. Powiązana z innymi elementami projektu GMOD: JBrowse, MAKER adres: http://gmod.org/wiki/webapollo demo: http://genomearchitect.org/webapollodemo
EagleView Adres: http://www.niehs.nih.gov/research/resources/software/biostatistics/eagleview/ Rozwijany przez: National Institute of Enviromental Health Sciences Stworzony w C++ Wspiera Windows, Linux, Mac Niezależna aplikacja Weichun Huang and Gabor T Marth, EagleView: a genome assembly viewer for nextgeneration sequencing technologies, Genome Res.,June 11, 2008, 10.1101/gr.076067.108
NCBI Genome Workbench Adres: http://www.ncbi.nlm.nih.gov/tools/gbench/ dostawca: National Center for Biotechnology Information Typ: Niezależna aplikacja Zastosowania: Szczególnie dostosowana do pozyskiwania i obsługi sekwencji zdeponowanych w NCBI Wspiera różne formaty plików Systemy operacyjne: Windows, Linux, Mac (wersja 2015) inne cechy: napisane w C++
Tablet adres: http://ics.hutton.ac.uk/tablet/ dostawca: James Hutton institute wspierane systemy operacyjne: Mac, Windows, Linux (koniec 2014 r.) Tablet features: High-performance visualization and data navigation. Display of reads in both packed and stacked formats. File format support for ACE, AFG, MAQ, SOAP2, SAM, BAM, FASTA, FASTQ, and GFF3. Import GFF3 features and quickly find/highlight/display them. Search and locate reads by name or subsequence across entire data sets. Paired end visualization support (for SAM/BAM). Entire-contig overviews, showing data layout or coverage information. Simple install routine via auto-updating graphical installers. Support for Windows, Apple Mac OS X and Linux, in 32 and 64-bit. Milne I, Stephen G, Bayer M, Cock PJA, Pritchard L, Cardle L, Shaw PD and Marshall D. 2013. Using Tablet for visual exploration of second-generation sequencing data. Briefings in Bioinformatics 14(2), 193-202.
Savant Genome Browser adres: http://genomesavant.com/p/savant/index dostawca: University of Toronto dostęp: otwarty typ: niezależna aplikacja wspierane systemy operacyjne: Mac, Windows, Linux (koniec 2013 r.)
Artemis: Genome Browser and Annotation Tool Artemis is a free genome browser and annotation tool that allows visualisation of sequence features, next generation data and the results of analyses within the context of the sequence, and also its six-frame translation. Artemis is written in Java, and is available for UNIX, Macintosh and Windows systems. It can read EMBL and GENBANK database entries or sequence in FASTA, indexed FASTA or raw format. Other sequence features can be in EMBL, GENBANK or GFF format. Links ACT - a DNA sequence comparison viewer DNAPlotter - makes circular and linear interactive plots BamView - interactive display of read alignments in BAM data files adres: https://www.sanger.ac.uk/resources/software/artemis/ dostawca: Wellcome Trust Sanger Institute