Zagadka sierocych otwartych ramek odczytu (ORF-anów)

Podobne dokumenty
PRAWA ZACHOWANIA. Podstawowe terminy. Cia a tworz ce uk ad mechaniczny oddzia ywuj mi dzy sob i z cia ami nie nale cymi do uk adu za pomoc

Dopasowanie sekwencji (sequence alignment)

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Projektowanie procesów logistycznych w systemach wytwarzania

Przypomnienie najważniejszych pojęć z baz danych. Co to jest baza danych?

gdy wielomian p(x) jest podzielny bez reszty przez trójmian kwadratowy x rx q. W takim przypadku (5.10)

Czy przedsiêbiorstwo, którym zarz¹dzasz, intensywnie siê rozwija, ma wiele oddzia³ów lub kolejne lokalizacje w planach?

DZIA 4. POWIETRZE I INNE GAZY

Powszechność nauczania języków obcych w roku szkolnym

Rys Mo liwe postacie funkcji w metodzie regula falsi

Nowoczesne systemy ekspresji genów

L A K M A R. Rega³y DE LAKMAR

Krótka informacja o instytucjonalnej obs³udze rynku pracy

CENTRUM BADANIA OPINII SPOŁECZNEJ

Fed musi zwiększać dług

Temat: Czy świetlówki energooszczędne są oszczędne i sprzyjają ochronie środowiska? Imię i nazwisko

GEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla uŝytkowników modułu wyszukiwania danych Warszawa 2007

POMIAR STRUMIENIA PRZEP YWU METOD ZWÊ KOW - KRYZA.

*** Przeczytaj najpierw, ponieważ to WAŻNE: ***

U S T A W A. z dnia. o zmianie ustawy o ułatwieniu zatrudnienia absolwentom szkół. Art. 1.

1. Od kiedy i gdzie należy złożyć wniosek?

Strategia rozwoju kariery zawodowej - Twój scenariusz (program nagrania).

Ethernet VPN tp. Twój œwiat. Ca³y œwiat.

WZORU UŻYTKOWEGO EGZEMPLARZ ARCHIWALNY. d2)opis OCHRONNY. (19) PL (n) Centralny Instytut Ochrony Pracy, Warszawa, PL

Systemy mikroprocesorowe - projekt

3.2 Warunki meteorologiczne

KOMISJA WSPÓLNOT EUROPEJSKICH. Wniosek DECYZJA RADY

Nagroda Nobla z fizjologii i medycyny w 2004 r.

Techniki korekcyjne wykorzystywane w metodzie kinesiotapingu

ZAPYTANIE OFERTOWE nr 4/KadryWM13

Od sekwencji do funkcji poszukiwanie genów i ich adnotacje

Czy warto byd w sieci? Plusy i minusy nakładania się form ochrony przyrody wsparte przykładami Słowioskiego Parku Narodowego

revati.pl Drukarnia internetowa Szybki kontakt z klientem Obs³uga zapytañ ofertowych rozwi¹zania dla poligrafii Na 100% procent wiêcej klientów

SPECYFIKACJA ISTOTNYCH WARUNKÓW ZAMÓWIENIA DLA PRZETARGU NIEOGRANICZONEGO CZĘŚĆ II OFERTA PRZETARGOWA

- o zmianie o Krajowym Rejestrze Sądowym

Formularz informacyjny dotyczący kredytu konsumenckiego

TEST dla stanowisk robotniczych sprawdzający wiedzę z zakresu bhp

Objaśnienia do Wieloletniej Prognozy Finansowej na lata

PADY DIAMENTOWE POLOR

Prezentacja dotycząca sytuacji kobiet w regionie Kalabria (Włochy)

4.3. Warunki życia Katarzyna Gorczyca

II. WNIOSKI I UZASADNIENIA: 1. Proponujemy wprowadzić w Rekomendacji nr 6 także rozwiązania dotyczące sytuacji, w których:

Blokady. Model systemu. Charakterystyka blokady


HAŚKO I SOLIŃSKA SPÓŁKA PARTNERSKA ADWOKATÓW ul. Nowa 2a lok. 15, Wrocław tel. (71) fax (71) kancelaria@mhbs.

Badanie doboru naturalnego na poziomie molekularnym

USTAWA. z dnia 29 sierpnia 1997 r. Ordynacja podatkowa. Dz. U. z 2015 r. poz

Bioinformatyka Laboratorium, 30h. Michał Bereta

Efektywna strategia sprzedaży

Opinie mieszkańców Lubelszczyzny o zmianach klimatu i gazie łupkowym. Raport z badania opinii publicznej

JĘZYK ANGIELSKI. Przedmiotowy system oceniania w klasach 1-3

Projektowanie bazy danych

Stanowisko Rzecznika Finansowego i Prezesa Urzędu Ochrony Konkurencji i Konsumentów w sprawie interpretacji art. 49 ustawy o kredycie konsumenckim

Rekompensowanie pracy w godzinach nadliczbowych

art. 488 i n. ustawy z dnia 23 kwietnia 1964 r. Kodeks cywilny (Dz. U. Nr 16, poz. 93 ze zm.),

Przygotowały: Magdalena Golińska Ewa Karaś

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Smart Beta Święty Graal indeksów giełdowych?

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Steelmate - System wspomagaj¹cy parkowanie z oœmioma czujnikami

UMOWA PORĘCZENIA NR [***]

DE-WZP JJ.3 Warszawa,

Regionalna Karta Du ej Rodziny

Podatek przemysłowy (lokalny podatek od działalności usługowowytwórczej) :02:07

IDZ DO KATALOG KSI EK TWÓJ KOSZYK CENNIK I INFORMACJE CZYTELNIA PRZYK ADOWY ROZDZIA SPIS TREŒCI KATALOG ONLINE ZAMÓW DRUKOWANY KATALOG

plezjomorfie: podobieństwa dziedziczone po dalszych przodkach (c. atawistyczna)

Jak usprawnić procesy controllingowe w Firmie? Jak nadać im szerszy kontekst? Nowe zastosowania naszych rozwiązań na przykładach.

Spis treści 1 Komórki i wirusy Budowa komórki Budowa k

III. GOSPODARSTWA DOMOWE, RODZINY I GOSPODARSTWA ZBIOROWE

WYZNACZANIE PRZYSPIESZENIA ZIEMSKIEGO ZA POMOCĄ WAHADŁA REWERSYJNEGO I MATEMATYCZNEGO

Koszty jakości. Definiowanie kosztów jakości oraz ich modele strukturalne

Załącznik nr 4 WZÓR - UMOWA NR...

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

METODA NAUKOWA. Biologia to nauka eksperymentalna. Cechuje się określoną metodologią i pragmatyzmem (podejmowanie

Zapytanie ofertowe. (do niniejszego trybu nie stosuje się przepisów Ustawy Prawo Zamówień Publicznych)

PIZZA FIESTA. CO MOŻNA ZOBACZYĆ NA KOSTCE? Składniki ( ryba, papryka, pieczarki, salami, ser)

tróżka Źródło:

(12) OPIS PATENTOWY (19) PL

1.2. Zakres stosowania z podaniem ograniczeń Badaniu nośności można poddać każdy pal, który spełnia wymogi normy PN-83/B

Polska-Warszawa: Usługi w zakresie napraw i konserwacji taboru kolejowego 2015/S

OŚWIADCZENIE MAJĄTKOWE. Skwierzyna. (miejscowość) CZĘŚĆ A. (miejsce zatrudnienia, stanowisko lub funkcja)

Strategia rozwoju sieci dróg rowerowych w Łodzi w latach

PRZEPIĘCIA CZY TO JEST GROźNE?

Instalacja. Zawartość. Wyszukiwarka. Instalacja Konfiguracja Uruchomienie i praca z raportem Metody wyszukiwania...

Program szkoleniowy Efektywni50+ Moduł III Standardy wymiany danych

Jacek Mrzyg³ód, Tomasz Rostkowski* Rozwi¹zania systemowe zarz¹dzania kapita³em ludzkim (zkl) w bran y energetycznej

Podręcznik ćwiczeniowy dla pacjenta

UMOWA PARTNERSKA. z siedzibą w ( - ) przy, wpisanym do prowadzonego przez pod numerem, reprezentowanym przez: - i - Przedmiot umowy

Instrukcja U ytkownika Systemu Antyplagiatowego Plagiat.pl

KATEDRA INFORMATYKI STOSOWANEJ PŁ ANALIZA I PROJEKTOWANIE SYSTEMÓW INFORMATYCZNYCH

INSTRUKCJA DLA UCZESTNIKÓW ZAWODÓW ZADANIA

Rozdział 6. Pakowanie plecaka. 6.1 Postawienie problemu

Rozdział 6. KONTROLE I SANKCJE

Zintegrowane Systemy Zarządzania Biblioteką SOWA1 i SOWA2 SKONTRUM

PL B BUP 19/04. Sosna Edward,Bielsko-Biała,PL WUP 03/10 RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11)

Warszawska Giełda Towarowa S.A.

2.Prawo zachowania masy

STOISKA - spis treœci STOISKA stoiska PROMOCYJNE stoiska SPRZEDA OWE stoiska TARGOWE stoiska SKLEPOWE / zabudowy

Instrukcja do Arkusza kosztorysowania sieci klasy NGA na obszarach wymagających wsparcia publicznego.

Współczesne nowoczesne budownictwo pozwala na wyrażenie indywidualnego stylu domu..

Transkrypt:

PRACE PRZEGL DOWE Zagadka sierocych otwartych ramek odczytu (ORF-anów) Pawe³ Mackiewicz, Krystian B¹czkowski, Maciej Sobczyñski, Stanis³aw Cebrat Zak³ad Genomiki, Instytut Genetyki i Mikrobiologii, Uniwersytet Wroc³awski, Wroc³aw Mystery of orphan Open Reading Frames (ORFans) Summary In spite of an increase of a number of sequenced genomes, 20-30% of Open Reading Frames (ORFs) do not show detectable sequence similarity to other sequences in databases and functions of their products have not been recognized. These ORFs are called ORFans and their abundance has been referred to as a mystery. A large fraction of ORFans are probably spurious non-coding ORFs generated by protein coding sequences or repeat sequences. Some ORFans are probably quickly evolving genes specific to narrow phylogenetic lineages. The most interesting group of ORFans are de novo generated genes with new functions and structures which may find some applications in biotechnology and medicine. It is also possible that some ORFans code for RNA regulatory molecules. Key words: ORFan, hypothetical gene, microbial genomics, evolution. Adres do korespondencji Pawe³ Mackiewicz, Zak³ad Genomiki, Instytut Genetyki i Mikrobiologii, Uniwersytet Wroc³awski, ul. Przybyszewskiego 63/77, 51-148 Wroc³aw; e-mail: pamac@microb.uni.wroc.pl 3 (70) 45 56 2005 1. ORF-y hipotetyczne Jedn¹ ze standardowych analiz przeprowadzanych po etapie sekwencjonowania genomu jest identyfikowanie w nim potencjalnych sekwencji koduj¹cych bia³ko i poszukiwanie podobnych do nich sekwencji wystêpuj¹cych w innych genomach homologów. Jednak pomimo dynamicznego przyrostu liczby kompletnie zsekwencjonowanych genomów i intensywnego rozwoju narzêdzi bioinformatycznych, oko³o 30% sekwencji potencjalnie ko-

Pawe³ Mackiewicz i inni duj¹cych bia³ka (tzw. ORF-ów otwartych ramek odczytu, ORF, Open Reading Frame) nie posiada przypisanych funkcji. Okreœla siê je jako geny hipotetyczne. Je eli takie ORF-y lub ich potencjalne produkty bia³kowe wykazuj¹ istotne podobieñstwo do innych genów obecnych w genomach pochodz¹cych z ró nych linii filogenetycznych, to okreœlane s¹ one terminem konserwatywne geny hipotetyczne. Stanowi¹ one oko³o 10% wszystkich adnotowanych potencjalnych genów w genomach mikroorganizmów. Najprawdopodobniej s¹ to sekwencje koduj¹ce bia³ko, a dla wielu z nich z czasem udaje siê przypisaæ za pomoc¹ metod eksperymentalnych i komputerowych istotne dla komórki funkcje (1). Istnieje jednak bardzo intryguj¹ca grupa ORF-ów hipotetycznych, które nie tylko nie posiadaj¹ przypisanej funkcji, ale równie nie maj¹ odpowiadaj¹cych sekwencji homologicznych w odleg³ych genomach. Generalnie okreœla siê je jako ORF-y sieroce, czyli ORF-any (2,3). Stanowi¹ one 20-30% wszystkich ORF-ów w nowo sekwencjonowanych genomach (3-9), a w niektórych (Plasmodium) nawet 60% (10). Stanowi¹ one du e wyzwanie dla genomiki. ORF-y sieroce s¹ bardzo niejednorodn¹ grup¹ (11) rysunek 1. ORF-any nie posiadaj¹ce adnych homologów nazywane s¹ singletonami lub ORF-anami pojedynczymi. Te, które posiadaj¹ homologi tylko w swoim genomie s¹ ORF-anami paralogicznymi, a te, które wykazuj¹ pewne podobieñstwo do ORF-ów wystêpuj¹cych w innych bardzo blisko spokrewnionych genomach (gatunkach) s¹ ORF-anami ortologicznymi. Aby uwzglêdniæ ich pewne podobieñstwo do bardzo w¹skiej grupy ORF-ów stosowany jest na ich okreœlenie równie termin PCOs (Poorly Conserved ORFs, 11). Rys. 1. Klasyfikacja sierocych otwartych ramek odczytu ORF-anów. 46 PRACE PRZEGL DOWE

Zagadka sierocych otwartych ramek odczytu (ORF-anów) 2. ORF-any Wydaje siê, e wraz ze wzrostem liczby nowo odkrywanych genów i rozwojem projektów sekwencjonowania genomów liczba ORF-anów powinna maleæ, natomiast obserwuje siê jej wzrost (2,12). Zjawisko to okreœlono tzw. tajemnic¹ lub paradoksem ORF-anów. W analizach przeprowadzonych na 127 genomach mikroorganizmów wykazano obecnoœæ 66 846 ORF-anów specyficznych gatunkowo, tzn. nie posiadaj¹cych homologów poza swoim gatunkiem (13). Œrednio w ka dym genomie wystêpuje 14,4% takich ORF-anów, przy czym najwiêcej z nich (52,3%) znaleziono w genomie Aeopyrum pernix, a najmniej u Buchnera sp. APS (0,2%). Obecnoœæ wielu ORF-anów u A. pernix najprawdopodobniej zwi¹zana jest z du ¹ liczb¹ adnotowanych w tym genomie przypadkowych ramek zachodz¹cych na koduj¹ce geny. W celu dok³adniejszej analizy tej grupy sekwencji stworzono bazê danych ORFanage poœwiêcon¹ tylko ORF-anom (14; www.bioinformatics.buffalo.edu/orfanage). Baza ta zawiera 31 850 pojedynczych ORF-anów stanowi¹cych 13% wszystkich ORF-ów zidentyfikowanych w 84 genomach. Istnienie ORF-anów, czyli sekwencji bez homologów jest trudne do wyt³umaczenia, zak³adaj¹c powszechnie znane mechanizmy ewolucji genów przez duplikacje innych genów. W ka dym z tych przypadków powinny istnieæ podobne sekwencje u innych organizmów lub w tym samym genomie. Nawet przyjmuj¹c powszechne poziome przenoszenie informacji genetycznej powinno siê znajdowaæ podobne sekwencje w gatunkach, które by³y dawcami nowych genów (tzw. ksenologów). Zaproponowano wiele ró nych hipotez t³umacz¹cych istnienie tej dziwnej grupy ORF-ów. 2.1. Ubogie bazy danych W najprostszym wyt³umaczeniu zak³ada siê, e obecnoœæ ORF-anów wynika ze zbyt ma³ej liczby sekwencji obecnych w bazach danych (2,3,12), dlatego nie jest mo liwe odnalezienie dla nich sekwencji podobnej. Jednak e, pomimo pewnego zmniejszenia tempa ich przyrostu, ca³kowita liczba ORF-anów roœnie wraz ze wzrostem liczby poznawanych genomów zamiast spadaæ (8,9,11). Tempo wzrostu nowo zsekwencjonowanych genomów wzrasta szybciej, tj. o 17,6% ni maleje liczba ORF-anów, tj. o 7,6% (13). Ka dy nowo dodawany genom przyczynia siê do spadku œrednio tylko o 0,1-0,2% udzia³u procentowego wszystkich ORF-anów (8). Przy dodaniu kolejno zsekwencjonowanego genomu roœnie ca³kowita liczba ORF-ów i ORF-anów w bazie, jednoczeœnie maleje procent ORF-anów w ca³ym zbiorze ORF-ów (rys. 2). Spadek jest jednak coraz mniejszy i stabilizuje siê przy kilkunastu procentach. Obserwowany pewien spadek frakcji ORF-anów zwi¹zany jest m.in. z dodawaniem genomów bardzo blisko spokrewnionych do ju istniej¹cych, np. szczepów tego samego gatunku (8), co powoduje tylko zmianê kategorii ORF-anu pojedynczego na ortologiczny (specyficznego dla gatunku lub w¹skiej grupy). BIOTECHNOLOGIA 3 (70) 45-56 2005 47

Pawe³ Mackiewicz i inni Rys. 2. Dynamika przyrostu ORF-anów pojedynczych (singletonów). Przy dodawaniu kolejno zsekwencjonowanych genomów (oœ X) roœnie ca³kowita liczba ORF-ów i ORF-anów w bazie (lewa oœ Y), jednoczeœnie maleje procent ORF-anów w ca³ym zbiorze ORF-ów (prawa oœ Y). Spadek jest jednak coraz mniejszy i stabilizuje siê przy kilkunastu procentach. Dane zaczerpniêto z bazy ORFanage (14; www.bioinformatics.buffalo.edu/orfanage). 2.2. Masowa utrata genów Wystêpowanie ORF-anów mo na wyt³umaczyæ utrat¹ genów, które pocz¹tkowo wystêpowa³y w wielu organizmach-przodkach, a w czasie ewolucji zanik³y w wielu potomnych liniach filogenetycznych, pozostaj¹c tylko w niektórych z nich (3,11). W tym przypadku ORF-any odpowiada³yby pojedynczym potomkom dawnych bia- ³ek, które zachowa³y siê tylko w niektórych liniach filogenetycznych lub organizmach. Zjawisko masowej utraty genów zosta³o obserwowane u wielu organizmów (15-18). Jednak w tym przypadku nale a³oby za³o yæ, e genom postulowanego przodka musia³by byæ ogromny i zawieraæ bardzo du ¹ liczbê genów zupe³nie dziœ nieznanych, albo, e niektóre geny yj¹ bardzo krótko. 2.3. Niekoduj¹ce artefakty Skoro ORF-any nie maj¹ homologów, a zatem bior¹ siê znik¹d, to mo e s¹ artefaktami, b³êdnie rozpoznanymi i adnotowanymi ORF-ami, które nie s¹ rzeczywistymi genami koduj¹cymi bia³ko. Liczba przypadkowych, niekoduj¹cych ORF-ów wzra- 48 PRACE PRZEGL DOWE

Zagadka sierocych otwartych ramek odczytu (ORF-anów) sta wyk³adniczo wraz ze spadkiem ich d³ugoœci (19-22). Dok³adnoœæ metod rozpoznaj¹cych geny zmniejsza siê w³aœnie w przypadku krótkich sekwencji, dlatego wiele b³êdnie adnotowanych ORF-ów powinno byæ krótszych ni znane sekwencje koduj¹ce. Rzeczywiœcie wiele ORF-anów prawdopodobnie niekoduj¹cych jest ORF-ami krótkimi, co stwierdzono zarówno u dro d y Saccharomyces cerevisiae, jak i w genomach prokariotycznych (3,8,13,23-26). Wed³ug bazy danych ORFanage 63,5% ORF-anów pojedynczych stanowi¹ ramki krótsze ni 150 kodonów. Co ciekawe, liczba ORF-anów krótszych ni 150 kodonów roœnie szybciej ni d³ugich i znika dwa razy wolniej ni d³ugich (8,11). Analizuj¹c sk³ad G+C wykazano, e ORF-any specyficzne gatunkowo posiadaj¹ mniejsz¹ zawartoœæ G+C ni nie-orf-any, zbli aj¹c siê do sk³adu sekwencji miêdzygenowych, co sugerowa³oby, e s¹ one ORF-ami niekoduj¹cymi wygenerowanymi w przestrzeniach miêdzygenowych. Jednak nie mo na wykluczyæ, e one koduj¹, a tylko podlegaj¹ mniejszej presji selekcyjnej, co upodabnia je do sekwencji miêdzygenowych (13). Chocia prawdopodobieñstwo wygenerowania d³ugich ORF-ów w sekwencji losowej (miêdzygenowej?) jest bardzo ma³e (19,22,27,28), to stosunkowo d³ugie ORF-y mog¹ byæ stosunkowo ³atwo generowane w sekwencjach koduj¹cych. Rzeczywiœcie, istnieje wiele ORF-ów zachodz¹cych na siebie w genomach wirusów, archeonów, bakterii i Eukaryotów (np. 29-40). Tylko w nielicznych przypadkach oba ORF-y zachodz¹ce s¹ koduj¹ce. Zaproponowano kilka mechanizmów generuj¹cych ramki zachodz¹ce na geny (41), takie jak: wysoka zawartoœæ par GC i u ywalnoœæ kodonów GNC i RNY (np. 30,31,34,42-46) oraz specyficzne w³aœciwoœci kodu genetycznego i sekwencji koduj¹cych (35,47). atwoœæ generowania d³ugich niekoduj¹cych ORF-ów nasuwa przypuszczenie, e czêœæ ORF-anów mog³a powstaæ w wyniku dawnych duplikacji ca³ych lub czêœci sekwencji koduj¹cych nios¹cych w sobie niekoduj¹ce zachodz¹ce ORF-y (23). Zduplikowane sekwencje akumulowa³y mutacje, które ostatecznie wyeliminowa³y w³aœciwe ramki odczytu genów pozostawiaj¹c ORF-y generowane. Rzeczywiœcie, dla oko³o 700 ORF-anów adnotowanych w genomie dro d y Saccharomyces cerevisiae przeczytanych w fazach niekoduj¹cych znaleziono istotne podobieñstwo do innych znanych sekwencji (23). 2.4. B³êdy sekwencjonowania lub pseudogeny Zasugerowano równie, e obecnoœæ ORF-anów jest efektem b³êdów pope³nionych w trakcie sekwencjonowania genomów, powoduj¹cych przesuniêcie ramki odczytu (2,3). W tym przypadku ich poprawienie (np. na podstawie porównania z innymi genomami) odtworzy³oby w³aœciw¹ sekwencjê koduj¹c¹. Jednak e tego typu zmiany w sekwencjach mog¹ dotyczyæ równie niefunkcjonuj¹cych ju genów pseudogenów, które naby³y mutacje zmieniaj¹ce ich strukturê. W tym przypadku zmiany mog¹ byæ na tyle du e, e mo e okazaæ siê niemo liwe odnalezienie sekwencji podobnej. Pseudogeny s¹ sekwencjami wystêpuj¹cymi zarówno w geno- BIOTECHNOLOGIA 3 (70) 45-56 2005 49

Pawe³ Mackiewicz i inni mach prokariotycznych (15,48-51), jak i eukariotycznych (52-56). W genomach Ricketsia stwierdzono, e oko³o 80% ORF-anów jest pseudogenami i wykazuje skrócenie oraz przesuniêcie ramki odczytu (57,58). Jednak e te genomy s¹ bardzo specyficzne i charakteryzuj¹ siê szczególn¹ tendencj¹ do redukcji swoich rozmiarów (59,60), dlatego za³o enie, e wszystkie ORF-any lub ich du a frakcja s¹ pseudogenami mo e nie dotyczyæ wielu innych genomów. 2.5. Szybko ewoluuj¹ce geny ORF-any s¹ wyró niane g³ównie na podstawie braku istotnych podobieñstw do innych sekwencji, dlatego zasugerowano, e stosowane algorytmy do poszukiwania sekwencji podobnych s¹ za ma³o czu³e, aby poprawnie rozpoznaæ ich potencjalne homologi. Mo e to dotyczyæ wielu ORF-anów zw³aszcza krótkich, poniewa krótkie sekwencje daj¹ z regu³y niskie wartoœci opisuj¹ce stopieñ podobieñstwa (8). Jednak- e wiele ORF-anów jest wystarczaj¹co d³ugich i powinny daæ wysokie wartoœci podobieñstwa, dlatego przyjêto hipotezê, e mog¹ one reprezentowaæ geny szybko ewoluuj¹ce w danej linii (grupie) filogenetycznej, których sekwencja zmieni³a siê na tyle, e uniemo liwia znalezienie sekwencji podobnych (2,3,13,18,61-63). Ka dy z sekwencjonowanych szczepów Escherichia coli, pomimo niedawnej dywergencji, posiada swój w³asny zestaw specyficznych dla danego szczepu ORF-anów (64), co sugeruje, e ta grupa ORF-ów musia³a powstaæ w bardzo krótkim czasie (65). U Drosophila wykazano, e oko³o 1/3 eksprymowanych genów podlega³a szybkiej (lub nawet neutralnej) ewolucji (66,67). Jednak czêœæ z nich nie wykazuje jawnego fenotypu, co sugeruje, e mog¹ one ju nie byæ sekwencjami koduj¹cymi. Szybkie tempo ewolucji wykazano dla ORF-anów specyficznych dla Escherichia coli oraz Salmonella enterica i uznanych za koduj¹ce (65). Fischer i Eisenberg (3) zaproponowali, e wiele ORF-anów mo e kodowaæ bia³ka b³onowe, które zachowuj¹c swoj¹ strukturê mog¹ bardziej zmieniaæ swoj¹ sekwencjê uniemo liwiaj¹c znalezienie homologów standardowymi algorytmami. Wiadomo, e struktura przestrzenna bia³ek ewoluuje wolniej ni sekwencja aminokwasowa (struktura pierwszorzêdowa). Przyjmuj¹c koncepcjê ORF-anów jako szybko ewoluuj¹cych genów, kodowa³yby one polipeptydy bêd¹ce odleg³ymi cz³onkami ju znanych rodzin bia³ek i posiada³yby podobne struktury przestrzenne i funkcje (3,9). Rzeczywiœcie, w przypadku niektórych ORF-anów stwierdzono, e ich produkty posiadaj¹ zidentyfikowane struktury przestrzenne i z³o enia bia³ek wystêpuj¹ce w ju znanych rodzinach bia³kowych (68). Aby uzyskaæ wiêcej informacji na temat szybko ewoluuj¹cych ORF-anów konieczne by³oby przeprowadzenie bardziej zaawansowanych analiz komputerowych opartych na profilach sekwencji, eksperymentalnych badañ biochemicznych lub eksperymentalnych i obliczeniowych analiz strukturalnych. 50 PRACE PRZEGL DOWE

Zagadka sierocych otwartych ramek odczytu (ORF-anów) 2.6. Geny nabyte w wyniku horyzontalnego transferu W ostatnich analizach wskazano, e du a czeœæ ORF-anów mog³a zostaæ nabyta od bakteriofagów w wyniku horyzontalnego transferu. Za takim pochodzeniem ORF-anów mo e œwiadczyæ to, e s¹ one krótkie, bogate w A+T i podlegaj¹ szybkiej ewolucji podobnie jak geny fagowe, a ponadto wystêpuj¹ w grupach w okolicach miejsc, do których integruj¹ siê fagi (13,65,69). Rzeczywiœcie, Shmuely i wsp. (70) wykazali, e bia³ko archebakteryjnego faga PhiCh1 jest podobne do ORF-anu paralogicznego wystêpuj¹cego u Halobacterium sp., natomiast Daubin i Ochman (65) zidentyfikowali istotne podobieñstwo miêdzy prawie 50 ORF-anami specyficznymi dla niektórych przedstawicieli gamma-proteobakterii a genami bakteriofagów. Brak homologów w przypadku wielu innych ORF-anów mo e wynikaæ ze s³abej znajomoœci genomów wirusów i fagów oraz z du ej dywergencji sekwencji nale ¹cych do tych grup. Chocia funkcji wiêkszoœci genów bakteriofagowych nie poznano, to przyjmuje siê, e czêœæ z nich odpowiada za utrzymanie profaga w genomie bakteryjnym przez dostarczanie gospodarzowi pewnych korzyœci. Wyjaœnia³oby to, dlaczego takie geny (ORF-any) nabyte od bakteriofagów s¹ u bakterii zachowywane po wyeliminowaniu przyleg³ych sekwencji fagowych. Kilka ORF-anów z genomu E. coli powsta³ych prawdopodobnie w ten sposób zaanga owanych jest w procesy translacji i replikacji (65). Wiele z nich ulega ekspresji w czasie stresu lub g³odu, co mo e wskazywaæ na stare powi¹zanie miêdzy tymi genami a samolubnymi elementami (selfish) mobilizowanymi w³aœnie w tym czasie. 2.7. Ca³kowicie nowe geny W zwi¹zku z tym, e wœród znanych sekwencji nie znajduje siê adnych homologów do ORF-anów, byæ mo e tworz¹ one nowe, wygenerowane de novo, nie znane jeszcze rodziny bia³ek posiadaj¹ce nowe struktury przestrzenne i byæ mo e nowe funkcje nie zaobserwowane w ju istniej¹cych rodzinach bia³ek (3,9,11,71,72). Przyjmuj¹c takie za³o enie niemal ka dy ORF-an (lub grupy ORF-anów paralogicznych i ortologicznych) musia³by byæ przedstawicielem nowej nadrodziny bia³ek. Liczba tych nadrodzin powinna byæ wielokrotnie wiêksza ni do tej pory przyjmowano (73,74) i, co wiêcej, nadrodziny te powinny byæ bardzo zró nicowane miêdzy sob¹ i odleg³e ewolucyjnie od ju znanych (3). Dla trzech ORF-anów stwierdzono, e posiadaj¹ one nowe, nie znane wczeœniej struktury przestrzenne i z³o enia bia³ek (68). Niewykluczone, e ORF-any tego typu zosta³y wygenerowane w innych fazach wewn¹trz ju istniej¹cych sekwencji koduj¹cych, które charakteryzuj¹ siê ³atwoœci¹ generowania stosunkowo d³ugich ORF-ów. Wielu autorów zwróci³o uwagê na tak¹ mo liwoœæ tworzenia nowych genów w ewolucji (31,33,41,44,47,75). Znaleziono BIOTECHNOLOGIA 3 (70) 45-56 2005 51

Pawe³ Mackiewicz i inni kilka przyk³adów tak wygenerowanych genów badaj¹c sekwencje dro d y (35) oraz cz³owieka i wirusów (76,77). W generowaniu nowych genów mog¹ odgrywaæ równie rolê sekwencje powtórzone. Przyk³adem genów wygenerowanych de novo przy ich udziale jest rodzina genów zwana morpheus wystêpuj¹ca u naczelnych (78), gen LQK1 (79) oraz gen AFGP koduj¹cy glikoproteinê zapobiegaj¹c¹ zamarzaniu ryb antarktycznych (80). 2.8. Niekoduj¹cy RNA Nie mo na wykluczyæ, e niektóre ORF-any, szczególnie u organizmów eukariotycznych, mog¹ reprezentowaæ RNA niekoduj¹ce bia³ek, które odgrywaj¹ du ¹ rolê u tych organizmów w regulacji ekspresji genów, organizacji materia³u genetycznego i ochronie przed paso ytami przez eliminowanie defektywnego RNA i RNA transpozonów oraz wirusów (81-83). Jest to stosunkowo niedawno odkryte zjawisko zwane wyciszaniem genów lub interferencj¹ RNA (RNAi RNA interference). Transkrypty niektórych ORF-anów (wygenerowanych w antysensie genów) mog³yby pe³niæ funkcjê regulatorow¹, hybrydyzuj¹c z transkryptami genów koduj¹cych bia³ka reguluj¹c ich ekspresjê. Gdyby okaza³o siê, e ORF-any koduj¹ funkcjonalne RNA, to by³yby one bardzo istotnym sk³adnikiem materia³u genetycznego. 2.9. Czy ORF-any s¹ sekwencjami koduj¹cymi? Najwa niejszym problemem zwi¹zanym z ORF-anami jest pytanie czy s¹ to sekwencje koduj¹ce? Jedna z metod okreœlaj¹cych czy dana sekwencja koduje bia³ko opiera siê na wynikach analiz potencjalnej liczby podstawieñ nukleotydowych w miejscach synonimicznych, w których zmiany nie wp³ywaj¹ na kodowany aminokwas i niesynonimicznych, zwi¹zanych ze zmian¹ kodowanego aminokwasu. Sekwencje koduj¹ce bia³ka powinny charakteryzowaæ siê wiêksz¹ liczb¹ substytucji w miejscach synonimicznych (Ks) ni w miejscach niesynonimicznych (Ka). W przeprowadzonych analizach ORF-anów Drosophila (63) oraz ORF-anów specyficznych dla linii Escherichia i Salmonella (65) wykazano, e ewoluuj¹ one podobnie do sekwencji koduj¹cych bia³ko i posiadaj¹ stosunek Ka/Ks mniejszy ni jeden. Na podstawie tej metody wykazano równie, e wiele krótkich ORF-ów w genomach mikroorganizmów przypomina pod tym wzglêdem sekwencje koduj¹ce bia³ko, a zatem mo e kodowaæ (84). W wielu przypadkach wykazano doœwiadczalnie, e ORF-any ulegaj¹ ekspresji (18,61,70,85, patrz równie 65). Jednak sam fakt transkrypcji nie mo e byæ wystarczaj¹cym dowodem na kodowanie bia³ka przez dan¹ sekwencjê. Wiele transkryptów mo e byæ fa³szywych, syntetyzowanych z sekwencji niekoduj¹cych po³o onych blisko promotorów. Stwierdzono ponadto, e nie ma korelacji miêdzy iloœci¹ mrna 52 PRACE PRZEGL DOWE

Zagadka sierocych otwartych ramek odczytu (ORF-anów) i iloœci¹ kodowanego przez nie bia³ka w komórkach dro d y (86), co mo e byæ m.in. zwi¹zane z obecnoœci¹ niekoduj¹cych transkryptów. Jednak e, brak zidentyfikowanych transkryptów dla niektórych ORF-ów niekoniecznie musi œwiadczyæ, e te ORF-y nie koduj¹ bia³ek. Mog¹ one ulegaæ ekspresji w innych warunkach ni zastosowane w doœwiadczeniu, albo ich poziom ekspresji mo e byæ bardzo niski i wobec tego niewykrywalny przez stosowane metody. W analizach komputerowych potencjalnych bia³ek kodowanych przez ORF-any specyficzne gatunkowo wykazano, e w porównaniu do reszty bia³ek charakteryzuj¹ siê one nieco mniejsz¹ hydrofobowoœci¹, s¹ mniejsze, i maj¹ wy szy punkt izoelektryczny, co sugeruje, e mog¹ one byæ czynnikami transkrypcyjnymi lub innymi bia³kami regulatorowymi wi¹ ¹cymi siê do kwasów nukleinowych (13,62). Niektórym ORF-anom, po dok³adniejszych analizach uda³o siê przypisaæ ró ne kategorie funkcjonalne, w tym rolê w transkrypcji i translacji (87,88, patrz równie 68). Przyk³adowo, uzyskano ekspresjê produktu genu ykfe z genomu Escherichia coli oznaczonego wczeœniej jako ORF-an i poddano go krystalizacji (88,89). Okaza³o siê, e produktem tego genu jest bia³ko homodimeryczne bêd¹ce inhibitorem lizozymu typu C. Okreœlono równie trójwymiarow¹ strukturê tego bia³ka i odszukano bia³ko o podobnej strukturze przestrzennej u Pseudomonas aeruginosa. Wczeœniej funkcja tego bia³ka by³a tak e nie znana. Jednak po analizach okaza³o siê, e bia³ko to jest równie inhibitorem lizozymu typu C. Dziêki przeprowadzonym analizom uda³o siê zatem okreœliæ now¹ rodzinê bia³ek bakterii. Rodzina ta jest bardzo ciekawa ze wzglêdu na wysoki stopieñ dywergencji sekwencji do niej nale ¹cych, oraz wysok¹ konserwatywnoœæ ich funkcji. 3. Zakoñczenie Widaæ, e adna z przedstawionych hipotez dotycz¹cych ORF-anów nie jest do koñca przekonuj¹ca. Najprawdopodobniej ta grupa ORF-ów jest bardzo niejednorodna zarówno pod wzglêdem pochodzenia, jak i roli w komórce. Obecnoœæ znacznej frakcji ORF-anów nie mo na t³umaczyæ ma³¹ liczb¹ poznanych genomów, bo mimo wzrostu tej liczby, frakcja ORF-anów nie maleje zgodnie z oczekiwaniami. Tylko bardzo niewielka czêœæ ORF-anów wynika z b³êdów sekwencjonowania, poniewa dok³adnoœæ odczytów sekwencji jest obecnie wysoka. Czêœæ ORF-anów, zw³aszcza krótkich, mo e byæ sekwencjami niekoduj¹cymi, wygenerowanymi w przestrzeniach miêdzygenowych, w sekwencjach powtórzonych i przede wszystkim w sekwencjach koduj¹cych bia³ko. Osobn¹ grupê mog¹ reprezentowaæ szybko ewoluuj¹ce geny specyficzne dla w¹skiej linii filogenetycznej. W tym przypadku sekwencje tych bia³ek uleg³y tak du ej dywergencji, e staje siê niemo liwe zidentyfikowanie dalszych homologów na poziomie struktury pierwszorzêdowej. Niewykluczone, e wiele z tych ORF-ów nie podlega selekcji i staje siê pseudogenami. Pewien udzia³ w tworzeniu ORF-anów mo e mieæ masowa utrata genów w ró nych liniach filoge- BIOTECHNOLOGIA 3 (70) 45-56 2005 53

Pawe³ Mackiewicz i inni netycznych oraz horyzontalny transfer genów, zw³aszcza od bakteriofagów. Najciekawsz¹ grupê ORF-anów mog¹ stanowiæ ORF-y koduj¹ce ma³ocz¹steczkowe RNA i ca³kowicie nowe geny koduj¹ce bia³ko o nowych funkcjach i strukturach. Poznanie natury ORF-anów jest wa ne dla poznania pe³nego zró nicowania bia³ek kodowanych w organizmie. Niektórym ORF-anom uda³o siê przypisaæ ju funkcje i poznaæ struktury przestrzenne ich produktów. Niewykluczone, e wœród ORF-anów znajduj¹ siê istotne dla funkcjonowania komórki bia³ka o ca³kowicie nowych, ciekawych strukturach, które mog¹ znaleÿæ zastosowanie w medycynie i biotechnologii. Szczególnie interesuj¹ce mog¹ siê okazaæ te geny, które s¹ zwi¹zane z patogennoœci¹ lub wirulencj¹. Literatura 1. Galperin M. Y., Koonin E. V., (2004), Nucleic Acids Res., 32, 5452-5463. 2. Dujon B., (1996), Trends Genet., 12, 263-270. 3. Fischer D., Eisenberg D., (1999), Bioinformatics, 15, 759-762. 4. Doolittle R. F., (1997), Nature, 388, 515-516. 5. Fraser C. M., Eisen J. A., Salzberg S. L., (2000), Nature, 406, 799-803. 6. Wren B. W., (2000), Nature Rev. Genet., 1, 30-39. 7. Boucher Y., Nesbo C. L., Doolittle W. F., (2001), Curr. Opin. Microbiol., 4, 285-289. 8. Siew N., Fischer D., (2003), Proteins: Struct. Funct. Genet., 53, 241-251. 9. Siew N., Fischer D., (2003), Structure (Camb), 11, 7-9. 10. Gardner M. J., Hall N., Fung E., White O., Berriman M., Hyman R. W., Carlton J. M., Pain A., Nelson K. E., Bowman S., et al., (2002), Nature, 419, 498-511. 11. Siew N., Fischer D., (2003), Comp. Funct. Genomics, 4, 432-441. 12. Casari G., de Druvar A., Sander C., Shneider R., (1996), Trends Genet., 12, 244-255. 13. Charlebois R. L., Clarke G. D., Beiko R. G., Jean A., (2003), FEMS Microb. Lett., 225, 213-220. 14. Siew N., Azaria Y., Fischer D., (2004), Nucleic Acids Res., 32, D281 D283. 15. Andersson J. O., Andersson S. G. E., (1999), Curr. Opin. Gen. Dev., 9, 664-671. 16. Aravind L., Watanabe H., Lipman D. J., Koonin E. V., (2000), Proc. Natl. Acad. Sci. USA, 97, 11319-11324. 17. Petrov D. A., Sangster T. A., Johnston J. S., Hartl D. L., Shaw K. L., (2000), Science, 287, 1060-1062. 18. Zdobnov E. M., von Mering C., Letunic I., Torrents D., Suyama M., Copley R. R., Christophides G. K., Thomasova D., Holt R. A., Subramanian G. M., et al., (2002), Science, 298, 149-159. 19. Termier M., Kalogeropoulos A., (1996), Yeast, 12, 369-384. 20. Das S., Yu L, Galtatzes C., Rogers R., Freeman J., Bienkowska J., Adams R. M., Smith T. F., (1997), Nature, 385, 29-30. 21. Basrai M. A., Hieter P., Boeke J. D., (1997), Genome Res., 7, 768-771. 22. Gierlik A., Mackiewicz P., Kowalczuk M., Dudek M. R., Cebrat S., (1999), Int. J. Modern Phys. C., 10, 635-643. 23. Mackiewicz P., Kowalczuk M., Gierlik A., Dudek M. R., Cebrat S., (1999), Nucleic Acids Res., 27, 3503-3509. 24. Skovgaard M., Jensen L. J., Brunak S., Ussery D., Krogh A., (2001), Trends Genet., 17, 425-428. 25. Mackiewicz P., Kowalczuk M., Mackiewicz P., Nowicka A., Dudkiewicz M., aszkiewicz A., Dudek M. R., Cebrat S., (2002), Yeast, 19, 619-629. 26. Mira A., Klasson L., Andersson S. G., (2002), Curr. Opin. Microb., 5, 506-512. 27. Senapathy P., (1986), Proc. Natl. Acad. Sci. USA, 83, 2133-2137. 28. Fickett J. W., (1994), Comput. & Chem., 18, 203-205. 29. Barrell B. G., Air G. M., Hutchison C. A., (1976), Nature, 264, 34-41. 54 PRACE PRZEGL DOWE

Zagadka sierocych otwartych ramek odczytu (ORF-anów) 30. Ikehara K., Okazawa E., (1993), Nucleic Acids Res., 21, 2193-2199. 31. Merino E., Balbas P., Puente J. L., Bolivar F., (1994), Nucleic Acids Res., 22, 1903-1908. 32. de Antonio A., D Angelo M., Dal Pero F., Sartorello F., Pandolfo D., Pallavicini A., Lanfranchi G., Valle G., (1997), Yeast, 13, 261-266. 33. Pavesi A., de Iaco B., Granero M. I., Porati A., (1997), J. Mol. Evol., 44, 625-631. 34. Rother K. I., Clay O. K., Bourquin J.P., Silke J., Schaffner W., (1997), Biol. Chem., 378, 1521-1530. 35. Cebrat S., Mackiewicz P., Dudek M. R., (1998), Biosystems, 42, 165-176. 36. Wang L. F., Park S. S., Doi R. H., (1999), J. Bacteriol., 181, 353-356. 37. Iwabe N., Miyata T., (2001), Gene, 280, 163-167. 38. Behrens M., Sheikh J., Nataro J. P., (2002), Infect. Immun., 70, 2915-2925. 39. Rogozin I. B., Spiridonov A. N., Sorokin A. V., Wolf Y. I., Jordan I. K., Tatusov R. L., Koonin E. V., (2002), Trends Genet., 18, 228-232. 40. Yelin R., Dahary D., Sorek R., Levanon E. Y., Goldstein O., Shoshan A., Diber A., Biton S., Tamir Y., Khosravi R., et al., (2003), Nat. Biotechnol., 21, 379-386. 41. Boldogkoi Z., (2000), J. Mol. Evol., 51, 600-606. 42. Boldogkoi Z., Murvai J., (1994), Virus Genes, 9, 47-51. 43. Boldogkoi Z., Murvai J., Fodor I., (1995), Trends Genet., 11, 125-126. 44. Ikehara K., Amada F., Yoshida S., Mikata Y., Tanaka A., (1996), Nucleic Acids Res., 24, 4249-4255. 45. Silke J., (1997), Gene, 194, 143-155. 46. Boldogkoi Z., Barta E., (1999), Biosystems, 51, 95-100. 47. Cebrat S., Dudek M. R., (1996), Trends Genet., 12, 12. 48. Mira A., Ochman H., Moran N. A., (2001), Trends Genet., 17, 589-596. 49. Lawrence J. G., Hendrix R. W., Casjens S., (2001), Trends Microbiol., 9, 535-540. 50. Homma K., Fukuchi S., Kawabata T., Ota M., Nishikawa K., (2002), Gene, 294, 25-33. 51. Liu Y., Harrison P.M., Kunin V., Gerstein M., (2004), Genome Biol., 5, R64. 52. Harrison P. M., Echols N., Gerstein M. B., (2001), Nucleic Acids Res., 29, 818-830. 53. Harrison P., Kumar A., Lan N., Echols N., Snyder M., Gerstein M., (2002), J. Mol. Biol., 316, 409-419. 54. Zhang Z., Harrison P., Gerstein M., (2002), Genome Res., 12, 1466-1482. 55. Harrison P. M., Milburn D., Zhang Z., Bertone P., Gerstein M., (2003), Nucleic Acids Res., 31, 1033-1037. 56. Torrents D., Suyama M., Zdobnov E., Bork P., (2003), Genome Res., 13, 2559-2567. 57. Ogata H., Audic S., Renesto-Audiffren P., Fournier P. E., Barbe V., Samson D., Roux V., Cossart P., Weissenbach J., Claverie J. M., Raoult D., (2001), Science, 293, 2093-2098. 58. Amiri H., Davids W., Andersson S. G. E., (2003), Mol. Biol. Evol., 20, 1575-1587. 59. Andersson J. O., Andersson S. G. E., (1999), Mol. Biol. Evol., 16, 1178-1191. 60. Andersson J. O., Andersson S. G. E., (2001), Mol. Biol. Evol., 18, 829-839. 61. Malpertuy A., Tekaia F., Casaregola S., Aigle M., Artiguenave F., Blandin G., Bolotin-Fukuhara M., Bon E., Brottier P., de Montigny J., et al., (2000), FEBS Lett., 487, 113-121. 62. Wood V., Rutherford K. M., Ivens A., Rajandream M.-A., Barrell B., (2001), Comp. Funct. Genom., 2, 143-154. 63. Domazet-Loso T., Tautz D., (2003), Genome Res., 13, 2213-2219. 64. Welch R. A., Burland V., Plunkett III G., Redford P., Roesch P., Rasko D., Buckles E. L., Liou S. R., Boutin A., Hackett J., et al., (2002), Proc. Natl. Acad. Sci., 99, 17020-17024. 65. Daubin V., Ochman H., (2004), Genome Res., 14, 1036-1042. 66. Schmid K. J., Tautz D., (1997), Proc. Natl. Acad. Sci. USA, 94, 9746-9750. 67. Schmid K. J., Aquadro C. F., (2001), Genetics, 159, 589-598. 68. Siew N., Fischer D., (2004), J. Mol. Biol., 342, 369-373. 69. Daubin V., Lerat E., Perriere G., (2003), Genome Biol., 4, R57. 70. Shmuely H., Dinitz E., Dahan I., Eichler J., Fischer D., Shaanan B., (2004), Bioinformatics, 20, 1248-1253. 71. Vitkup D., Melamud E., Moult J., Sander C., (2001), Nat. Struct. Biol., 8, 559-566. 72. Lee D., Grant A., Buchan D., Orengo C., (2003), Curr. Opin. Struct. Biol., 13, 359-369. BIOTECHNOLOGIA 3 (70) 45-56 2005 55

Pawe³ Mackiewicz i inni 73. Chothia C., (1992), Nature, 357, 543-544. 74. Orengo C. A., Jones D. T., Thornton J. M., (1994), Nature, 372, 631-634. 75. Keese P. K., Gibbs A., (1992), Proc. Natl. Acad. Sci. USA, 89, 9489-9493. 76. Facchiano A., (1995), J. Mol. Evol., 40, 570-577. 77. Facchiano A., Facchiano F., van Renswoude J., (1993), J. Mol. Evol., 36, 448-457. 78. Johnson M. E., Viggiano L., Bailey J. A., Abdul-Rauf M., Goodwin G., Rocchi M., Eichler E. E., (2001), Nature, 413, 514-519. 79. Lipovich L., Hughes A. L., King M. C., Abkowitz J. L., Quigley J. G., (2002), Gene, 286, 203-213. 80. Chen L., DeVries A. L., Cheng C. H., (1997), Proc. Nat. Acad. Sci. USA, 94, 3811-3816. 81. Eddy S. R., (2001), Nat. Rev. Genet., 2, 919-929. 82. Wagner E. G., Flardh K., (2002), Trends Genet., 18, 223-226. 83. Mattick J. S., (2003), BioEssays, 25, 930-939. 84. Ochman H., (2002), Trends Genet., 18, 335-337. 85. Alimi J. P., Poirot O., Lopez F., Claverie J. M., (2000), Genome Res., 10, 959-966. 86. Gygi S. P., Rochon Y., Franza B. R., Aebersold R., (1999), Mol. Cell. Biol., 19, 1720-1730. 87. Hutchison C. A. III, Peterson S. N., Gill S. R., Cline R. T., White O., Fraser C. M., Smith H. O., Venter J. C., (1999), Science, 286, 2165-2169. 88. Monchois V., Abergel C., Sturgis J., Jeudy S., Claverie J. M., (2001), J. Biol. Chem., 276, 18437-18441. 89. Abergel C., Monchois V., Chenivesse S., Jeudy S., Claverie J. M., (2000), Acta Cryst., D56, 1694-1695. 56 PRACE PRZEGL DOWE