Politechnika Śląska. Wydział, Automatyki, Elektroniki i Informatyki



Podobne dokumenty
Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

Zawartość. Wstęp. Moduł Rozbiórki. Wstęp Instalacja Konfiguracja Uruchomienie i praca z raportem... 6

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.

Porównywanie i dopasowywanie sekwencji

Instalacja programu:

Instrukcja. importu dokumentów. z programu Fakt do programu Płatnik. oraz. przesyłania danych do ZUS. przy pomocy programu Płatnik

Nowa Netia administrator firmy Nagrywanie połączeń-zarządzanie

Bioinformatyczne bazy danych - część 2. -przeszukiwanie baz danych -pobieranie danych

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2)

5.5. Wybieranie informacji z bazy

Wykaz stali z projektu.

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (1)

Rozdział ten zawiera informacje o sposobie konfiguracji i działania Modułu OPC.

S P I S T R E Ś C I. Instrukcja obsługi

Bazy danych i R/Bioconductor

Bioinformatyka Laboratorium, 30h. Michał Bereta

Część 3 - Konfiguracja

PODSTAWY BIOINFORMATYKI

KS-ZSA. Mechanizm centralnego zarządzania rolami

Logowanie do systemu. Rys. 1 Strona logowania

Wyszukiwanie i zamawianie artykułów za pośrednictwem strony internetowej

System Informatyczny Oddziału Wojewódzkiego NFZ

Dopasowanie sekwencji (sequence alignment)

Edytor materiału nauczania

Serwis jest dostępny w internecie pod adresem Rysunek 1: Strona startowa solidnego serwisu

Zagadnienia: Ścieżki do informacji - wpisywanej po znaku ukośnika / Nazwy dokumentu (w szczególności strony www, czyli strony internetowej).

Memeo Instant Backup Podręcznik Szybkiego Startu

Podstawy technologii WWW

INSTRUKCJA OBSŁUGI PEŁNA KSIĘGOWOŚĆ. Artykuły

Minimalna wspierana wersja systemu Android to zalecana 4.0. Ta dokumentacja została wykonana na telefonie HUAWEI ASCEND P7 z Android 4.

Artykuły. Spis treści Artykuły sprzedaży... 2 Artykuły zakupu... 3 Pozycja magazynowa... 5 Grupy artykułów (w pakiecie PRO)... 6

Statystyczna analiza danych

Moduł rozliczeń w WinUcz (od wersji 18.40)

WPROWADZENIE WYSZUKIWANIE OGŁOSZEŃ

Podręcznik użytkownika Wprowadzający aplikacji Wykaz2

KATOWICE, MARZEC 2018 WERSJA 2.0

Zasady tworzenia podstron

Sky-Shop.pl. Poradnik. Pierwsze kroki: Importowanie własnego pliku XML Integracje z hurtowniami

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka

BUDOWA I FUNKCJA GENOMU LUDZKIEGO

1. KEGG 2. GO. 3. Klastry

Wyszukiwanie i zamawianie artykułów za pośrednictwem strony internetowej

PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA

Co nowego w programie GM EPC

2.4 Planowanie i przydzielanie pracy

Jak poruszać się po ebrokerpartner?

INSTRUKCJA OBSŁUGI SKLEPU INTERNETOWEGO. Alu System Plus Sp.J. ul.leśna 2d Chrzanów, tel.(+48-32)

Podręcznik Użytkownika 360 Księgowość

Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji

etrader Pekao Podręcznik użytkownika Strumieniowanie Excel

Technologie Internetowe Raport z wykonanego projektu Temat: Internetowy sklep elektroniczny

Instrukcja obsługi Konfigurator MLAN-1000

Instrukcja korzystania z Krajowego Rejestru Agencji Zatrudnienia

Jak przygotować pliki gotowe do publikacji w sieci za pomocą DigitLabu?

REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką

Bioinformatyczne bazy danych

plansoft.org Zmiany w Plansoft.org Panel wyszukiwania PLANOWANIE ZAJĘĆ, REZERWOWANIE SAL I ZASOBÓW

Plan nauczania informatyki Opracował: mgr Daniel Starego

Instrukcja użytkownika ARSoft-WZ3

Włączanie/wyłączanie paska menu

WinSkład / WinUcz 15.00

Podręcznik użytkownika Publikujący aplikacji Wykaz2

CEMEX Go. Katalog zamówień i produktów. Wersja 2.1

Wirtualne Biuro. Nowoczesne technologie w budowaniu relacji z mediami. Prosta i skuteczna komunikacja Dystrybutor systemu:

INSTRUKCJA SYSTEMU AUKCYJNEGO PKO LEASING

KS-ZSA. Mechanizm aktualizacji kartotek lokalnych w aptece na podstawie zmian w kartotece CKT. Data aktualizacji:

Wyszukiwanie i zamawianie artykułów za pośrednictwem strony internetowej

Laboratorium Technologii Informacyjnych. Projektowanie Baz Danych

Materiał szkoleniowy:

Bioinformatyczne bazy danych

Wyszukiwanie plików w systemie Windows

SYSTEM ZARZĄDZANIA RELACJAMI Z KLIENTEM CRM7

Instrukcja obsługi systemu e-faktury.no

Skrócona instrukcja obsługi

Backend Administratora

FARA INTENCJE ONLINE. Przewodnik dla użytkownika programu FARA. Włodzimierz Kessler SIGNUM-NET

INSTRUKCJA PROGRAMOWANIA KASY FISKALNEJ I-ERGOS 3050 PRZY POMOCY PROGRAMU PLU MANAGER I-ERGOS.

INSTRUKCJA OBSŁUGI MODUŁU RODZICA

Ogranicz listę klasyfikacji budżetowych do powiązanych z danym kontem księgowym

MATERIAŁY - udostępnianie materiałów dydaktycznych w sieci SGH

Szanowni Państwo. Należy przy tym pamiętać, że zmiana stawek VAT obejmie dwie czynności:

Miejski System Zarządzania - Katowicka Infrastruktura Informacji Przestrzennej

O2Symfonia by CTI. Instrukcja i opis programu

ERGODESIGN - Podręcznik użytkownika. Wersja 1.0 Warszawa 2010

Wstęp do Biologii Obliczeniowej

1. Dockbar, CMS + wyszukiwarka aplikacji Dodawanie portletów Widok zawartości stron... 3

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

System Informatyczny CELAB. Terminy, alarmy

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite

Instrukcja systemu aukcyjnego poleasingowe.pl

4.2. Ustawienia programu

Spotkania z wiedzą webinarium

Konfiguracja Trimble Access Sync

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania KOMPUTEROWE SYSTEMY STEROWANIA (KSS)

OMNITRACKER Wersja testowa. Szybki przewodnik instalacji

Dokumentacja Administratora portalu. aplikacji. Wirtualna szkoła

WPROWADZENIE DO BAZ DANYCH

Instrukcja wyszukiwania w katalogach i bazach Biblioteki

Transkrypt:

Politechnika Śląska Wydział, Automatyki, Elektroniki i Informatyki Wybrane bazy danych adnotacji funkcjonalnych charakterystyka, opis, analiza jako struktury i powiązań. Analiza jakości oraz popularności poszczególnych baz danych. Raport Techniczny Daria Kogut dr inż. Aleksandra Gruca

Baza danych Pfam: Baza danych pfam należy do grupy baz xfam; baza ta jest ogólnodostępna i darmowa, zawiera informacje dotyczące białek, ich rodzin oraz powiązań pomiędzy nimi. Ponadto baza ta wyszukuje domeny białkowe na podstawie zadanej sekwencji oraz na podstawie dopasowania konstruuje profile ukrytych modeli Markowa. Pfam dzieli się na dwie podbazy: Pfam- A i Pfam- B. Pfam- A zawiera informacje, które przed każdą publikacją sprawdzają kuratorzy; Pfam- A obejmuje znaczną część sekwencji z całej bazy sekwencji podstawowych. Jednak aby baza sprawiała wrażenie bardziej wiarygodnej i zaufanej i mogącej oferować kompleksową pomoc w szukaniu pożądanych sekwencji został stworzony dodatek wykorzystujący ponadto bazę ADDA. Wpisy te (powiązane z bazą ADDA) są generowane jako Pfam- B. Takie powiązania z innymi bazami danych są niezwykle przydatne, gdy w podstawowej bazie nie zostanie znaleziony odpowiedni wpis. Na podstawie sekwencji aminokwasowej kodującej Cytochrom- B przedstawiono poniżej wyniki, jakie można uzyskać korzystając z tej bazy. Rys.1- wklejenie sekwencji aminokwasowej

Okno wynikowe wskazało dwie domeny, które najlepiej się dopasowują do zadanej sekwencji białek. Wyświetlające się propozycje wyników są wyświetlane w kolejności od najlepszego dopasowania. Kuratorzy określili pewien próg dopasowania, dla którego wyświetlają się wyniki. Przyciskając Show można podejrzeć jak bardzo dopasowane są sekwencje do siebie. W celu uzyskania szerszych informacji dotyczących białka wystarczy wejść w odnośnik. Przeszukując bazę do poszukiwań angażuje się zarówno Pfam- A jak i Pfam- B. Pfam jest w taki sposób zaprojektowany aby uniknąć redundancji i filtruje uzyskiwane wyniki, aby się nie powielały. W tym miejscu można znaleźć wszystkie informacje dotyczące szukanego białka. Pierwsza zakładka (Summary) zawiera informacje z Wikipedii. Wpisy te są sprawdzane bądź też pisane przez kuratorów. Domain organisation- informacje podstawowe o szukanej domenie Clan i Alignments zawierają informacje o rodzinie białka, stopniu i rodzaju dopasowania, HMM logo wizualizuje profile ukrytych modeli Markowa; można też zobaczyć drzewo filogenetyczne (Zakładka Trees) przedstawiające

badane białko oraz sto białek najbliżej z nim spokrewnionych. Curation & model- zawiera dane o białku z pfam, czyli np. identyfikatory, autorów wpisu, czyli wszelkie informacje techniczne. Ostatnia zakładka (Structures) służy do zaprezentowania graficznego (rozkładu) danej rodziny białek dla wszystkich gatunków. Oprócz podstawowych informacji o białku można uzyskać również informacje o domenach. Co zawierają domeny? Nr sekwencji związków homologicznych Opis tekstowy architektury, Odnośnik zawierający informacje o sekwencji opisanej w sposób graficzny, Opis sekwencji białka z bazy UniProt, Struktura graficzna z Pfam. Oprócz szukania białek za pomocą sekwencji, baza Pfam umożliwia szukanie także po nazwach (zakładka Browse), w której można znaleźć np. po liście rodzin. Informacje dotyczące bazy: Baza Pfam jest powiązana z wieloma różnymi bazami danych, między innymi z NCBI, PDB, MyHits (baza zawierająca domeny białkowe), UniProt, Metagenomic, czy też TrEMBL. Baza ta może pobierać identyfikatory z PDB; łącząc się z bazą UniProtKB Pfam pobiera sekwencje bądź podobnie jak w przypadku PDB numery identyfikacyjne. Można także wyszukiwać domeny za pomocą numeru GI z NCBI. Oczywiście Pfam ma także swoje identyfikatory, jednak jeżeli nie zna się ich nomenklatury można bez problemu się posłużyć numerami z baz wymienionych powyżej.

Istnieje również możliwość pobierania informacji ze strony za pomocą programów wpisując w kod adres bazy oraz numery identyfikacyjne poszczególnych białek). Ponadto baza ta jest bazą regularnie aktualizowaną przez kuratorów (ostatni wpis zarejestrowano na 15.05.2014), oprócz tego wszystkie nieaktualne lub błędne wpisy są usuwane. Jest też bardzo popularna, o czym mówi ilość cytowań w PubMed. InterPro jest popularną bazą zajmującą się analizą funkcjonalności białek, klasyfikowaniem ich do rodzin oraz przewidywaniem miejsc wiążących. Jest to baza silnie zintegrowana z innymi bazami i razem dokonują ścisłej i dokładnej analizy. Jest to baza nadzorowana przez kuratorów, którzy łączą wpisy reprezentujące tę samą domenę, rodzinę bądź witrynę z informacjami na ich temat do jednego wpisu. Ponadto sprawdzają prawidłowość opisywanych procesów pod kątem biologicznym oraz uzupełniają literaturę, z której czerpali informacje. W EBI InterPro jest używany do opisywania sekwencji białkowych z UniProtKB, można także użyć jej [bazy] do automatycznego przypisywania ontologii genowych do sekwencji białkowych. Baza jest aktualizowana co około osiem tygodni; w odnośniku Release Notes Page można sprawdzić zmiany, które wprowadziła aktualizacja. Twórcy strony zadbali również o to, aby użytkownik mógł się sprawnie poruszać po stronie i umieścili na niej odpowiednie tutoriale dotyczące m.in. odpowiedniej interpretacji wyników. Bazy, które tworzą Konsorcjum: Prosite- Baza rodzin białek i domen, HAMAP- Ręczna adnotacja białek, Pfam baza rodzin oraz domen białek, Prints kompendium odcisków białek, ProDom Baza zawierająca domeny homologiczne, SMART Zajmuje się identyfikacją i adnotacją domen zmiennych genetycznie oraz zajmuje się analizą architektury danych, TIGRAFAMs Identyfikacja funkcjonalnie spokrewnionych białek na podstawie homologii sekwencji,

PIRSF Superfamily Zawiera profile Ukrytych Modeli Markowa, reprezentuje wszystkie białka o znanej strukturze, CATH-Gene3d opisuje kompletnych genomach, rodziny białek, architektury domeny PANTHER Zbiór rodzin białek oraz ich podrodzin. Ponownie korzystając z sekwencji Cytochromu B sprawdzono jak ta baza działa: w

Wyniki wyszukiwania znalazły rodzinę, do jakiej należy badana sekwencja oraz domeny. Graficznie przedstawione wykresy obrazują dopasowania sekwencji bądź powtórzenia. Ciągi znaków zaznaczone kolorem czerwonym są to numery identyfikacyjne rodzin czy też domen z różnych baz danych, a także niezidentyfikowane podpisy. Najczęściej litery początkowe sugerują do jakiej bazy należy. Można w każdy odnośnik wejść i znaleźć informacje bezpośrednio w bazie danych. Na dole strony można znaleźć także numery identyfikacyjne GO. Oprócz domen i rodzin są także wpisy dotyczące powtórzeń, miejsc wiążących lub też wpisy nie zaklasyfikowane do żadnej z wyżej wymienionych. Strona także proponuje szybki przegląd wyników ze względu na dopasowanie sekwencji, organizację domeny czy też listy publikacji. Family - Rodzina białek to grupa białek, które mają wspólne pochodzenie ewolucyjne oraz podobieństwa w sekwencji. Domain Domeny są to glupy białek podzielone ze względu na funkcje, które wykonują. Repeats Wpisy zaklasyfikowane do tej grupy charakteryzują się sekwencją, która jest powtarzana w białku. Sites Wskazuje miejsca wiążące, miejsca aktywne czy też obszary potranslacyjne. Informacje dotyczące bazy: Istnieje możliwość pobierania informacji dzięki dodatkowi zamieszczonemu na stronie- InterProScan, który można wykorzystać w różnych programach np. w języku C++, Java, Perl, PHP, Python czy Taverna. Twórcy strony zastrzegają, żeby z powodu licznych awarii i przeciążeń liczba prób nie przekraczała pewnej

określonej ilości. Oprócz tego moderatorzy umieścili na stronie nazwy operacji, którymi można się posłużyć oraz zasady ich działania. InterProScan 5 korzysta z Java Message Service (JMS) do zarządzania komunikacją między elementami architektury, z których każdy może być uruchamiany na różnych urządzeniach (fizycznych bądź wirtualnych). InterProScan 5 jest przeznaczony przede wszystkim do pracy w linii poleceń. Poprzednie wersje do pobrania zawierały interfejs WWW, ale uznano, że funkcja ta była używana tylko przez niewielką część użytkowników i zostało usunięte z wersji 5. Jednakże, użytkownicy mogą nadal uzyskać graficzną prezentację InterProScan 5 za pomocą opcji -f HTML lub-f SVG. Struktura bazy: PANTHER (Protein ANalysis THrough Evolutionary Relationships)- jest to baza, która zajmuje się klasyfikacją białek (i ich genów) w celu ułatwienia dokonania

dokładnej analizy. Obecnie baza ta zawiera kompletne zestawy genów kodujących białka dla 85 organizmów. Oprócz zestawu genów PANTHER również zawiera informacje o ontologach i paralogach, które są wynikiem specjacji (powstania dwóch gatunków podczas ewolucji); wskazuje także, które gatunki są najbardziej do siebie zbliżone. Baza sama w sobie jest bardzo powolna, do wielu informacji nie ma dostępu i powoli się wczytują dane (lub w ogóle). Przede wszystkim nie działa zakładka ftp oraz dodatek służący do generowania drzew filogenetycznych. Klasyfikacja białek: Białka klasyfikuje się na rodziny i podrodziny, funkcje białek, procesy biologiczne oraz ze względu na ścieżki czyli relacje pomiędzy cząsteczkami wzajemnie na siebie oddziaływującymi np. w szlaku przemian biochemicznych. O tym, jak białko zostaje zaklasyfikowane decydują kuratorzy, którzy ręcznie przypisują białka do odpowiednich klasyfikatorów lub zostają przydzielone do odpowiedniej klasy poprzez użycie zaawansowanych algorytmów bioinformatycznych. Wyszukiwanie informacji. Informacje na temat białek czy też genów można uzyskać poprzez szukanie po sekwencji oraz po numerze ID z powiązanych baz danych (Ensembl, EntrezGene, NCBI, HGNC <<HUGO Gene Nomenclature>>, IPI<<International Protein Index>> oraz UniProt).

Numer GI z bazy NCBI Pierwszym krokiem jest wpisanie numeru identyfikacyjnego pożądanego genu, następnie wybiera się spośród puli organizm, u którego chce się dokonać analizy, a ostatnim krokiem jest wybranie rodzaju analizy, którą chce się wykonać. Po uzupełnieniu wszystkich informacji należy kliknąć submit. Wyniki przedstawione są w tabeli, która zawiera informacje na temat białka (np. informacje dotyczące funkcji białka w danym organizmie, wszelakie ontologie czy

też rodzina, do której należy). Gdy wejdzie się w odnośnik FCRL3, ukażą się dokładne informacje dotyczące białka wraz ze ścieżką czy też drzewem filogenetycznym oraz listą ontologów i odnośników do nich. Oprócz wyszukiwania pojedynczych genów można mieć wgląd w cały genom organizmów oraz procentowy udział genów czy klas białek.

Baza SMART jest bardzo przejrzystą i bardzo prostą stroną, która umożliwia znajdowanie informacji na temat identyfikacji, struktur oraz annotacji domen białkowych. Baza zawiera ponad pięćset rodzin. Domeny można wyszukiwać w dwojaki sposób: Sposób pierwszy (i najprostszy) to wpisanie nazwy białka w okno wyszukiwarki. Przed wyszukiwanie można także wybrać domyślną bazę, którą chce się przeszukiwać (PFAM, Signal Peptides, Internal Repeats, Intrinsic Protein Disorder). Wszystkie wpisy są sprawdzane przez kuratorów. Poprzez stałe zwiększanie się liczby dodawanych wpisów rośnie także redundancja, chociaż twórcy strony robią wszystko, aby ją zminimalizować. W wyniku otrzymuje użytkownika kluczowi. się listę domen odpowiadającej wpisanemu przez

Wchodząc w którykolwiek odnośnik wyświetlają się informacje dotyczące zastosowania domeny, abstrakt oraz dane dotyczące gatunków, w których znaleziono podobną lub identycznie działającą domenę, literaturę oraz inne odnośniki zawierające informacje o domenie. Drugim sposobem(bardziej zaawansowanym) jest szukanie po numerze ID czy też po sekwencji (jeżeli chce się analizować sekwencję). Gdy przedmiotem badań jest architektura wtedy się szuka po domenie lub po terminach GO.

Powyższy zrzut z ekranu przedstawia wynik wyszukiwania przykładowego białka. Grafika w lewym górnym rogu przedstawia rozkład oraz architekturę poszczególnych domen znalezionych przez bazę oraz ich długości i jest to graficzne przedstawienie danych, które znajdują się w tabelach poniżej. Pozostałe zakładki (architecture i orthology) zawierają dokładniejsze informacje o architekturze oraz o ortologach. W najnowszej wersji bazy SMART zostało wprowadzone bardzo ciekawe i przydatne narzędzie- itol. Narzędzie te służy do wyświetlania drzew filogenetycznych w konfiguracji kołowej na podstawie domen SMART (między innymi). Bazę SMART można podzielić na trzy części: Normal SMART, Genomic SMART oraz metasmart. Przyjrzyjmy się bliżej metasmart. metasmart jest poświęcona eksploracji domen białkowych i ich architektur w różnych metagenomowych zbiorach danych (chodzi o bazę Metagenomica). Można wybrać, z którego zbioru danych chce się poznać architekturę domeny. Można albo wpisać interesującą nasz domenę, albo wyszukiwać i odkrywać na podstawie zbioru danych. Wynikiem są propozycje struktur, białko, z którego pochodzi dana domena oraz zbiór danych, z której informacje te pochodzą.

Bazy, z którymi łączy się baza SMART: UniProt, Ensembl, HMMER, NCBI (PubMed). Prawdopodobnie SMART nie używa własnej nomenklatury.

OMIM (Online Mendelian Inheritance in Man) jest stale aktualizowanym katalogiem ludzkich genów i zaburzeń genetycznych ze szczególnym uwzględnieniem relacji zmienności genetycznej i ekspresji fenotypowej. Baza ta posiada swój unikalny system numeracji, dzięki któremu w łatwy sposób można zidentyfikować, do jakiej grupy należy szukany gen. Informacje można uzyskać z dowolnego miejsca bazy NCBI. Każdy numer jest sześciocyfrową kombinacją (tzw numer MIM), w której pierwsza cyfra klasyfikuje gen do odpowiedniej grupy. 1(.. ) i 2(..) Położenia autosomów lub fenotypy (wpisy, które zostały utworzone przed 15 maja 1994r.), 3(..) miejsca połączeń z chromosomem X lub fenotypy, 4(..) miejsca połączeń z chromosomem Y lub fenotypy, 5(..) położenia mitochondriów lub fenotypy 6(..) Położenia autosomów lub fenotypy (wpisy, które zostały utworzone po 15 maja 1994 r. Przed numerami można także napotkać różnego rodzaju znaki, które także dostarczają informacje dotyczące wpisu: * - oznacza, że dany wpis jest genem # - informuje, że jest to opis wpisu, zazwyczaj fenotypu i nie zawiera informacji o (unikalnych miejscach), + - informuje, że dany wpis zawiera opis genu o znanej sekwencji oraz fenotyp, % - opisuje sprawdzony fenotyp mendlowski lub miejsce fenotypu, którego podstawy molekularne nie zostały poznane, ^ - wpis usunięty Brak znaku () Nie znając numerów MIM także można bez problemu uzyskać informacje na temat genów- po nazwie, identyfikatorze z NCBI czy też EnsEMBL (Uwaga! Jednak nie we wszystkich przypadkach!) czy też po prostym równoważniku zdań (oczywiście w języku angielskim).

Wyszukiwanie: Przedstawiono sposób wyszukiwania na przykładzie hemofilii. Wyniki przedstawiły listę genów, które mogłyby być odpowiedzialne za hemofilię. Wchodząc na dowolny odnośnik można znaleźć w nim takie informacje jaka jest budowa genu, szczegółowy opis, rys historyczny, mapowanie genu, jego lokalizacja itp. W przypadku wyszukiwania fenotypów czy też chorób genetycznych można znaleźć także informacje o dziedziczeniu danej cechy czy też objawach klinicznych. Ponadto każdy wpis zawiera informacje stricte techniczne tzn. data utworzenia wpisu, autora oraz literaturę, z której korzystano. Nr MIM lokalizacja Numer MIM fenotypu

Oprócz standardowego wyszukiwania można także skorzystać z opcji wyszukiwanie zaawansowane, w której można szukać geny w konkretnym chromosomie, regionie, w którym się dany gen znajduje itp (zakładka Gene Map).

Informacje o bazie: Baza ta jest stale aktualizowana(co miesiąc), w zakładce Statistisc Update List można znaleźć informacje na temat ilości nowych bądź aktualizowanych wpisów w danym miesiącu. Ponieważ OMIM należy do NCBI, to prawdopodobnie nie jest redundantna z żadną bazą; wpisy są sprawdzane przez kuratorów. (doczytać) Inne bazy, które są powiązane z OMIM (wybór): Ensembl MITOMAP NCBI MapViewer UCSC UniProt HPRD KEGG Gene Ontology Baza danych Jaspar jest kolekcją transkrypcyjnych czynników wiążących DNA modelowanych jako matryce. Mogą one być konwertowane do pozycjonowanej macierzy wag w celu użycia ich do przeglądania sekwencji genomowych. Baza Ostatnia aktualizacja Pfam 2014 r. KEGG Struktura bazy Popularność duża duża BioCarta InterPro mirnatargets 2013 r. duża

Jaspar TFBS Omim Diseases 2014 r. co miesiąc Panther Pathways SMART Domains średnia 2011 r. Relacyjna średnia Literatura: (SMART) Ivica Letunic, Tobias Doerks and Peer Bork* SMART 7: recent updates to the protein domain annotation resource (OMIM) (McKusick, V.A.: Mendelian Inheritance in Man. A Catalog of Human Genes and Genetic Disorders. Baltimore: Johns Hopkins University Press, 1998 (12th edition). Słowniczek: Domena białka jest to fragment cząsteczki białka, który można wyodrębnić ze względu na samoistną zdolność zachowania swojej struktury trójwymiarowej niezależnie od całej cząsteczki.