Przykład Najlepszym sposobem zilustrowania zintegrowanej natury systemu Entrez jest porównanie dwóch przykładów biologicznych z uŝyciem wersji WWW Entrez jako interfejsu. Najprostszym sposobem przeszukiwania Entrez jest uŝycie indywidualnych terminów wyszukiwania, powiązanych z operatorami Boolean jak AND, OR czy NOT. RozwaŜmy przypadek, w którym wymagane jest pobranie wszystkich artykułów omawiających aspirynę w kontekście leczenia lub zapobiegania aterosklerozie. Startując z domowej strony WWW Entrez moŝna wybrać PubMed z rozwijanego paska menu w celu zaznaczenia, Ŝe przeszukiwanie ma obejmować część bibliograficzną przestrzeni wyszukiwania Entrez. W okno tekstowe znajdujące się po prawej stronie moŝna wpisać po prostu atherosclerosis [MH] AND aspirin [NM]. Przypis [MH] odnoszący się do pierwszego terminu informuje Entrez o tym, ze jest to termin MeSH; MeSH jest skrótem pochodzącym od medical subject heading (medyczny nagłówek tematu) i stanowi kwalifikator, który powinien być uŝyty do przeszukiwania tematycznego. Określenie [NM] kwalifikujące drugi termin oznacza, Ŝe jest to nazwa chemiczna lub nazwa substancji. W tym przypadku przeszukiwanie daje w rezultacie 197 artykułów. UŜytkownik moŝe następnie zawęzić kryterium wyszukiwania przez dodanie kolejnych terminów, jeśli jest zainteresowany w bardziej specyficznym aspekcie farmakologii lub jeśli przeszukiwanie zwróciło w wyniku zbyt wiele artykułów. W tym celu uŝytkownik ma do dyspozycji całą listę dostępnych kwalifikatorów. Na tym etapie, w celu przejrzenia jednego konkretnego artykułu spośród wyników wyszukiwania, uŝytkownik moŝe wybrać za pomocą myszki nazwisko autora, będące zarazem łącznikiem do odpowiedniego artykułu. Postępując w ten sposób, uŝytkownik jest doprowadzany do widoku streszczenia (Abstract view) wybranego artykułu. Strona Abstract view zawiera tytuł artykułu, listę autorów, ich przynaleŝność organizacyjną oraz samo streszczenie w standardowym formacie. Dostępny jest szereg alternatywnych formatów prezentacji tej informacji, wybór jednego z nich jest moŝliwy za pomocą rozwijanego menu znajdującego się obok przycisku Display (wyświetl). Przełączenie formatu na Citation dostarcza w efekcie zapis o bardzo podobnym wyglądzie, z tą róŝnicą Ŝe katalogowanie informacji w rodzaju terminów MeSH i indeksowanych substancji związanych z tą pozycją pokazane jest poniŝej streszczenia. Format MEDLINE generuje układ MEDLINE/MEDLARS, z dwuliterowymi kodami odpowiadającymi zawartości kaŝdego z pól zamieszczonych jeden pod drugim po lewej stronie zapisu (na przykład pole autora oznaczone jest kodem AU). Dane w tym formacie mogą zostać zapisane i importowane w łatwy sposób do innych programów zarządzających danymi bibliograficznymi, jak EndNote lub Reference Manager. 1
W górnej części zapisu znajduje się szereg łączników, którym warto poświęcić więcej uwagi. Pierwszy, połoŝony po prawej stronie, jest to łącznik zwany Related Articles (artykuły pokrewne). Jest to jeden z punktów wyjścia, przy uŝyciu którego uŝytkownik moŝe rozpocząć postępowanie oparte na sąsiadowaniu i twardych łącznikach, opisanych wcześniej. Jeśli wybrany zostanie łącznik Related Articles, Entrez powiadomi o istnieniu konkretnej liczby pozycji sąsiadujących z odnośnikiem oryginalnego artykułu - ozancza to, Ŝe narzędzie wyszukiwawcze znalazło taką liczbę odnośników do artykułów o podobnej tematyce - ułoŝonych w hierarchii odpowiadającym stopniowi podobieństwa tematycznego. Pierwszym odnośnikiem na takiej liście jest sam artykuł oryginalny, poniewaŝ z definicji jest on najbardziej spokrewniony sam ze sobą ( macierzysty ). Porządek w jakim sąsiadujące pozycje są wymieniane odpowiada stopniowi statystycznego podobieństwa. Zatem pozycja połoŝona najbliŝej pozycji macierzystej jest uwaŝana za najbardziej zbliŝoną tematycznie. Przeglądając tytuły, uŝytkownik moŝe łatwo odnaleźć informację związaną z innymi badaniami, jak równieŝ szybko zgromadzić literaturę związaną z wymienionymi na liście odnośnikami. Jest to funkcja szczególnie uŝyteczna i oszczędna czasowo podczas przygotowywania projektów grantowych, lub artykułów naukowych, gdyŝ moŝna na bieŝąco przeglądać streszczenia oraz wybrać najbardziej interesujące artykuły przed udaniem się do biblioteki. Kolejny łącznik w serii oznaczony jest jako Books (ksiąŝki), a wybranie go prowadzi do wersji oryginalnego cytowania, obfitującego w kolejne uŝyteczne łączniki. Podświetlone słowa w tej prezentacji odpowiadają słowom kluczowym przekierowujących uŝytkownika do elektronicznych wersji pełnotekstowych ksiąŝek, które są dostępne za pośrednictwem NCBI. Jeśli uŝytkownik przykładowo wybierze słowo atherosclerosis, to zostanie przeniesiony do odpowiedniej części przeglądanej ksiąŝki, np. rozdziału poświęconego komórkowemu importowi cholesterolu przez endocytozę za pośrednictwem receptorów. Ostatni łącznik w serii połoŝonej w górnej prawej części oznaczony jest jako LinkOut. Ta funkcja dostarcza listę innych stron WWW oraz zasobów związanych z tematem przeglądanej pozycji w Entrez, jak na przykład pełnotekstowe artykuły, które moŝna przeglądać korzystając bezpośrednio z przeglądarki internetowej, lub moŝliwość zamówienia danego dokumentu za pośrednictwem takich usług jak Loansome Doc. Podręczny serwis do LinkOut pozwala uŝytkownikom ustalić które łączniki wyświetlone zostaną w oknie LinkOut. Innym sposobem uzyskania wersji pełnotekstowej artykułu jest skorzystanie z łącznika do strony WWW wydawcy. Przy odpowiednich uprawnieniach indywidualnej lub instytucjonalnej subskrypcji, moŝna bezpośrednio obejrzeć pełny tekst artykułu, wraz z rysunkami i tabelami. Istnieje jeszcze inny sposób przeprowadzenia kwerendy w Entrez, zawierający kilka cech wbudowanych do systemu. RozwaŜmy przykład podjęcia próby znalezienia 2
wszystkich genów kodujących białka wiąŝące DNA w metanobakteriach. W tym przypadku, przeszukiwanie powinno zacząć się od ustawienia opcji Search rozwijanego menu na Nucleotide a następnie wpisania w oknie tekstowym terminu DNA-binding. Takie przeszukiwanie zwróci 23,797 pozycji, w których pojawia się ten termin. W tym miejscu, w celu zawęŝenia zakresu przeszukiwania, uŝytkownik powinien wybrać łącznik Limits, znajdujący się bezpośrednio pod oknem tekstowym. To przeniesie go do nowej strony, która pozwoli uŝytkownikowi zawęŝenie poszukiwań jak to wynika z nazwy samego łącznika. Przeszukiwanie moŝna zawęzić według kryterium organizmu, wówczas opcja Limited To w rozwijanym menu zmieniona zostaje na Organism, a w okno tekstowe naleŝy wpisać słowo methanobacterium. Wybierając myszką przycisk Go zwróci wszystkie te pozycje, w których badanym organizmem jest Methanobacterium (303). Wyniki pierwszego przeszukiwania moŝna równieŝ połączyć z wynikami drugiej serii przeszukiwań przez wybranie łącznika History znajdującego się poniŝej okna tekstowego, co w efekcie wyświetli listę ostatnio uŝywanych kwerend. Lista ta pokazuje poszczególne kwerendy, informację o ich zawęŝaniu do wybranych pól, czas w którym była wykorzystywana oraz liczbę pozycji znalezionych przy jej zastosowaniu. W celu połączenia dwóch oddzielnych kwerend w jedną, uŝytkownik w prosty sposób łączy ich numery porządkowe; w omawianym przykładzie, poniewaŝ kwerendy posiadają numery #8 i #9, składnia powinna wyglądać #8 AND #9. Wybranie za pomocą myszki przycisku Preview odświeŝa tabelę, przedstawiając nową, połączoną kwerendę oznaczoną numerem #10 i zawierającą trzy pozycje, w formacie streszczenia nukleotydowego. Tak jak poprzednio, istnieje seria łączników w górnej prawej części dla kaŝdej ze znalezionych pozycji; trzy są pokazane dla pierwszej pozycji na liście, która dotyczy genu tfx M. thermoautotropicum. Łącznik PubMed odsyła uŝytkownika z powrotem do pozycji literaturowej lub kilku pozycji odpowiadających tej pozycji w bazie GenBank. Wybierając przycisk Protein otrzymuje się jedno z powiązań łączników twardych, ukazujące zapis w bazie GenPept odpowiadający translacji genu tfx. NaleŜy zwrócić uwagę na to, Ŝe w obrębie samego zapisu, nazwa naukowa organizmu występuje jako łącznik; wybranie go przenosi uŝytkownika do taksonomicznej bazy danych NCBI, w której udostępniona jest informacja o przynaleŝności taksonomicznej wybranego organizmu. Jednym z uŝytecznych przeglądów na tym poziomie jest przegląd graficzny (Graphics view); widok jest graficznym przedstawieniem wszystkich cech opisanych w tabeli własności znalezionego zapisu, dostarczając bardzo uŝytecznego przeglądu, szczególnie jeśli tabela własności jest bardzo obszerna. Łącznik Related Sequences umoŝliwia podgląd wszystkich sekwencji podobnych do sekwencji genu tfx na poziomie nukleotydowym, przedstawiając w gruncie rzeczy nieprzerobione wyniki przeszukiwań BLAST. Ostatnia omawiana część Entrez dotyczy struktur. Kwerendy strukturalne mogą być tworzone bezpośrednio za pomocą opcji Structure w rozwijanym menu Search. 3
Przypuśćmy, Ŝe poszukiwana jest informacja o strukturze fragmentu HMG B ze szczura, którego kodem akcesyjnym jest 1HMF. Wpisując 1HMF w ramkę kwerendy uŝytkownik uzyskuje stronę streszczenia odnoszącego się do 1HMF, która ma zdecydowanie inny format niŝ jakakolwiek z oglądanych do tej pory stron. Strona ta pokazuje szczegóły nagłówka dokumentu źródłowego MMDB (który pochodzi z PDB), łączy z PubMed oraz danymi taksonomicznymi organizmu źródłowego, oraz łączy z sąsiadującymi sekwencjami i strukturami. Łączniki Sequence Neighbors prowadzą do sekwencji sąsiadujących z 1HMF - w oparciu o wyszukiwarkę BLAST - zatem chociaŝ jest to wpis strukturalny, naleŝy zdawać sobie sprawę, Ŝe sekwencje sąsiadujące nie mają wiele wspólnego z informacja strukturalną, przynajmniej nie bezpośrednio. W celu uzyskania informacji o strukturach pokrewnych, moŝna skorzystać z jednego z łączników Structure Neighbor generującego tabelę takich struktur w podobnej postaci jak przy uruchamianiu VAST. Dla uŝytkownika zainteresowanego gromadzeniem wstępnych danych o kształcie białka, zapewniony jest wydajny interfejs podłączonego programu Cn3D, wywoływanego przez wybranie myszką przycisku View/Save Structure, oraz dostarczającego znacznie więcej informacji niŝ moŝna wywnioskować na podstawie zwykłej analizy łańcucha symboli literowych (czyli sekwencji białka). Białko moŝna obracać wokół jego osi za pomocą suwaków w dolnej, górnej i prawej części okna, lub moŝe być obracane swobodnie przez przytrzymanie i przeciąganie kursora myszy po nakierowaniu go na oglądaną strukturę. Istnieje moŝliwość dokonania zbliŝeń poszczególnych regionów struktury lub zmiany kolorów na rysunku w celu oznaczenia specyficznych cech strukturalnych związanych z białkiem (np. wybranie opcji Spacefilling (model czaszowy) i Hydrophobicity (hydrofobowość) jako sposób prezentacji struktury (Render) i oznaczania kolorami (Color)). Ponadto uŝytkownicy mogą zapisać do pliku informację o współrzędnych oraz przeglądać dane za pomocą aplikacji zewnętrznych jak na przykład Kinemage (Richardson i Richardson, 1992) i Rasmol (Sayle i Milner-White, 1995). Na koniec, w kaŝdym punkcie korzystania z Entrez, istnieje moŝliwość zachowania części lub całości wyników przeszukiwania podczas przejścia do kolejnej analizy z uŝyciem nowej kwerendy, poprzez uŝycie przycisku Add to Clipboard. Skorzystanie z tej funkcji powoduje zachowanie wyników otrzymanych dla bieŝącej kwerendy, które mogą zostać przywrócone przez kliknięcie na łącznik Clipboard znajdujący się bezpośrednio pod oknem tekstowym. Podręczny notatnik (Clipboard) jest w stanie przechować maksymalnie 500 takich pozycji przez 1 godzinę. Opcje wyszukiwania Boolean dla Entrez Ogólna składnia: szukany termin [tag] operator boolean szukany termin [tag]... gdzie [tag]= [AD] PrzynaleŜność organizacyjna 4
[ALL] [AU] O Brien JB, itd. [RN] [EDAT] [IP] [TA] [LA] [MAJR] [MH] [PS] [DP] [PT] [SH] [NM] [TW] [UID] [VI] Wszystkie pola Nazwisko autora O Brien J [AU] wyszukuje wszystkie wpisy spośród O Brien JA, O Brien J [AU] wyszukuje tylko O Brien J Kod enzymu lub numery Serwisu Chemical Abstract Data Entrez YYYY/MM/DD, YYYY/MM, lub YYYY Numer wydania czasopisma Tytuł czasopisma, oficjalny skrót, lub numer ISSN Journal of Biological Chemistry J Biol Chem 0021-9258 Język Zasadniczy temat MeSH Jeden z głównych tematów poruszanych w artykule Terminy MeSH Sprawdzany słownik terminów biomedycznych (temat) Nazwa osobista jako temat UŜywane kiedy nazwisko określa temat artykułu, np. Varmus H [PS] Data publikacji YYYY/MM/DD, YYYY/MM, lub YYYY Rodzaj publikacji Praca przeglądowa Eksperyment kliniczny Wykłady Komunikat Publikacja techniczna Nagłówek podrzędny UŜywany dla modyfikacji terminów MeSH hypertension [MH] AND toxicity [SH] Nazwa substancji Nazwy chemiczne będące omawianym przedmiotem w artykule Słowa tekstowe Wszystkie słowa i liczby występujące w tytule i streszczeniu, terminy MeSH, nagłówki podrzędne, nazwy chemiczne, nazwiska jako słowa tematyczne oraz drugorzędowe źródła MEDLINE Unikalne identyfikatory (numery PMID/MEDLINE) Tom czasopisma a operator boolean = AND, OR, lub NOT 5