Bioinformatyka Wykład 3. E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas Bazy danych Wykład 3, 2008 1
Niesekwencyjne BazyDanych bibliograficzne kliniczne ścieżek metabolicznych i oddziaływania między biocząsteczkami struktur molekularnych Większość jest kroslinkowanych i dostepnych za pomocą zwykłych przeglądarek Sekwencyjne Bazy Danych sekwencji nukleotydowych sekwencji białkowych MetaBazy Wykład 3, 2008 2
Inny podział BazDanych Podział według [Michael Y. Galperin, Nucleic Acids Research, 2008, Vol. 36, Database issue D2-D4, The Molecular Biology Database Collection: 2008 update] Bazy Sekwencji nukleotydowych International Nucleotide Sequence Database Collaboration DDBJ - DNA Data Bank of Japan EMBL Nucleotide Sequence Database GenBank Kodujących i nie-kodującyhdna Struktury Genów, Intronów i Egzonów, miejsc Splicingu Miejsc regulatorowych transkrypcji i czynników transkrypcji Bazy sekwencji RNA Bazy sekwencji Białkowych Ogólne bazy sekwencji ExProt NCBI Protein Database PIR Swiss-Prot Własności białek Lokalizacji białek Sekwencji motywów i miejsc aktywnych w białkach Domen białkowych, klasyfikacji białek Indywidualne Bazy Rodzin Białkowych Bazy Strukturalne Bazy genomowe (organizmów nie-szkieletowych) Bazy Ścieżek Sygnałowych i Metabolicznych Bazy Genomowe Człowieka i innych organizmów szkieletowych Bazy Ludzkich Genów i Chorób Bazy Danych Mikromacierzowych i innych dotyczących Ekspresji Genów Bazy zasobów proteomicznych Inne Bazy Biologii Molekularnej Bazy Organelli Bazy roślin Bazy Immunologiczne Łącznie ponad 1300 różnych baz danych. Bibliograficzne bazy danych PubMed (http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed ) Baza dostępna w Systemie Entrez I rozwijana przez NCBI (Narodowe Centrum Informacji Biotechnologicznej) w NLM (Narodowej Bibliotece Medycznej) Bookshelf (http://www.ncbi.nlm.nih.gov/portal/query.fcgi?db=books ) PMB (http://pmd.ddbj.nig.ac.jp/ ) Protein Mutant Database, Baza PMB oparta jest na publikacjach a nie na sekwencjach białkowych. Każda mutacja białkowa znajdująca się w Bazie zwiazana jest z jednym artykułem WormBook(http://www.wormbook.org/ ) kolekcja rozdziałów związanych tematycznie z Caenorhabditis elegans. W skład WormBooks wchodzi również kolekcja metod i protokołów stosowanych w badaniach nad C.elegans WormMethods. Wykład 3, 2008 3
Wykład 3, 2008 4
Kliniczne BazyDanych OMIM (http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=omim ) HGMD (http://www.hgmd.cf.ac.uk/ ) Human Gene Mutation Database Baza Mutacji Genów Ludzkich w Instytucie Genetyki medycznej w Cardiff Całkowity zbiór mutacji (17.03.2008) wynosi ok. 57301 dla niekomercyjnych użytkowników, dla użytkowników komercyjnych 76011. CFTR (http://www.genet.sickkids.on.ca/cftr/app )Baza poświęcona mutacjom genu Cystic Fibrosis Transmembrane Regulator (CFTR). Mutacja w obrębie tego genu prowadzi do mukowiscydozy. LensGDDB Human Lens Genetic Disease Database (http://ken.mitton.com/ern/lensbase.html ) I inne. Wykład 3, 2008 5
Wykład 3, 2008 6
Ścieżek metabolicznych i oddziaływania między biocząsteczkami HPRF (http://hprd.org/ ) IntAct InteractionDatabase http://www.ebi.ac.uk/intact/site ) MINT Molecular INTeraction database (http://mint.bio.uniroma2.it/mint/welcome.do ) DIP Database of Interacting Proteins (http://dip.doe-mbi.ucla.edu/ ) Wykład 3, 2008 7
Wykład 3, 2008 8
Bazy Struktur Molekularnych PDB Protein Data Bank (http://www.rcsb.org/pdb ) NDB Nucleic Acid Database (http://ndbserver.rutgers.edu/ ) Repozytorium trój-wymiarowej informacji strukturalnej o kwasach nukleinowych Iczba zdeponowanych struktur: 3762 Structures ( 27-Febuary-2008) SCOP (Structural Classification of Proteins)( http://scop.mrclmb.cam.ac.uk/scop/) Baza ręcznie klasyfikowanych domen strukturalnych oparta na podobieostwie sekwencji i struktury 3D CATH (http://www.cathdb.info/latest/index.html) The CATH Protein Structure Classification półautomatyczna, hierarchiczna klasyfikacja domen białkowych Wykład 3, 2008 9
Sekwencyjne Bazy Danych Bazy Sekwencji Nukleotydowych The International Nucleotide Sequence Databases (INSDC) Międzynarodowa Baza sekwencji Nukleotydowych oparta na współpracy między trzema bazami: DDBJ (Japonia), EMBL (Europa, UK) i GenBank (USA). Bazy sekwencji genów Gene Sequence Database EMBL (Europa) (http://www.ebi.ac.uk/) EMBL Europejski zbiór sekwencji DNA i RNA 83,666,567 sekwencji (15.12.2006) GenBank (USA) (http://www.ncbi.nlm.nih.gov/genbank/index.html) 65,369,091,950 zasad w 61,132,599 rekordach sekwencji. DDBJ (Japonia) (http://www.ddbj.nig.ac.jp/index-e.html ) Wykład 3, 2008 10
Genomowe BazyDanych HGV Human Genome Variation Society (http://www.hgvs.org/ ) Celem tego stowarzyszenia jest odkrywanie I charakteryzowanie zmienności genowych w rozkładzie populacyjnym i w związkach fenotypowych GDB The huma Genom Da tabase (http://www.gdb.org/ ) Genomowa baza danych poświę cona ge nomowi Cz łowieka. Ensembl. Wspólny proje kt EMBL -EBI oraz Sanger Institute (http://www.ensembl.org/index.html ) ( nie-ludzkie bazy) MGI Mause Genom Informatics FlyBase ACeDB idt Bazy Sekwencji Białkowych ExPASy (Expert Protein Analysis System) (http://www.expasy.ch/ ) Baza UniProt Knowledgebase składa się z: UniProtKB/SwissProt - Protein knowledgebase UniProt/TrEMBL - Computer-annotated suplement do Swiss-Prot -bezpośrednie tłumaczenieformatu z EMBL na SwissProt UniProtKB/TrEMBL (computer-annotated): 5395414 sekwencji UniProtKB/Swiss-Prot (high-level annotation): 356194 sekwencji PIR -Protein Information Resorce (http://pir.georgetown.edu/) Wykład 3, 2008 11
Strona Białek: ExPASy strona domowa SwissProt i TrEMBL zbiór narzędzi bioinformatycznych jedna z pierwszych stron bioinformatycznych http://www.expasy.ch/ Wykład 3, 2008 12
MetaBazy Meta Bazy czyli super-bazy baz grupujące i udostępniające powiązane ze sobą informacje z różnych źródeł Entrez (Global Query Cross-Database Search System) (http://www.ncbi.nlm.nih.gov/sites/gquery ) Wykład 3, 2008 13
Wykład 3, 2008 14
Wykład 3, 2008 15
Wykład 3, 2008 16
Przykład: Co to jest zwłóknienie komórek (Mukowiscydoza)? Wykład 3, 2008 17
Wykład 3, 2008 18
Wykład 3, 2008 19
Wykład 3, 2008 20
Wykład 3, 2008 21
Wykład 3, 2008 22
Następny wykład anatomia plików z danymi wyszukiwanie, pobieranie i porównywanie sekwencji sposoby porównywania sekwencji KONIEC Wykład 3, 2008 23