(86) Data i numer zgłoszenia międzynarodowego: , PCT/EP99/04171 (87) Data i numer publikacji zgłoszenia międzynarodowego:

Podobne dokumenty
Przegląd budowy i funkcji białek

WYNALAZKI BIOTECHNOLOGICZNE W POLSCE. Ewa Waszkowska ekspert UPRP

21. Wstęp do chemii a-aminokwasów

46 i 47. Wstęp do chemii -aminokwasów

Informacje. W sprawach organizacyjnych Slajdy z wykładów

Inwestycja w przyszłość czyli znaczenie ochrony własności przemysłowej dla współczesnej biotechnologii

Chemiczne składniki komórek

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Nowoczesne systemy ekspresji genów

WYKŁAD 4: MOLEKULARNE MECHANIZMY BIOSYNTEZY BIAŁEK. Prof. dr hab. n. med. Małgorzata Milkiewicz Zakład Biologii Medycznej.

Agenda: Wynalazek jako własnośd intelektualna. Co może byd wynalazkiem. Wynalazek biotechnologiczny. Ochrona patentowa

WPROWADZENIE DO GENETYKI MOLEKULARNEJ

KLONOWANIE DNA REKOMBINACJA DNA WEKTORY

Bioinformatyka Laboratorium, 30h. Michał Bereta

Geny i działania na nich

WPROWADZENIE DO GENETYKI MOLEKULARNEJ

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

spektroskopia elektronowa (UV-vis)

Bioinformatyka Laboratorium, 30h. Michał Bereta

protos (gr.) pierwszy protein/proteins (ang.)

Materiały pochodzą z Platformy Edukacyjnej Portalu

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Proteomika: umożliwia badanie zestawu wszystkich lub prawie wszystkich białek komórkowych

Wykład 14 Biosynteza białek

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Dr. habil. Anna Salek International Bio-Consulting 1 Germany

Wybrane techniki badania białek -proteomika funkcjonalna

Patentowanie wynalazków z dziedziny biotechnologii

etyloamina Aminy mają właściwości zasadowe i w roztworach kwaśnych tworzą jon alkinowy

Bioinformatyka Laboratorium, 30h. Michał Bereta

Inwestycja w przyszłość czyli znaczenie ochrony własności przemysłowej dla współczesnej biotechnologii

Budowa aminokwasów i białek

Inżynieria genetyczna- 6 ECTS. Inżynieria genetyczna. Podstawowe pojęcia Część II Klonowanie ekspresyjne Od genu do białka

PL B1. SANOFI-AVENTIS DEUTSCHLAND GmbH, Frankfurt nad Menem,DE ,DE, BUP 26/

Slajd 1. Slajd 2. Proteiny. Peptydy i białka są polimerami aminokwasów połączonych wiązaniem amidowym (peptydowym) Kwas α-aminokarboksylowy aminokwas

Test kwalifikacyjny Lifescience dla licealistów 2015

Biologia molekularna z genetyką

Drożdżowe systemy ekspresyjne

(86) Data 1 numer zgłoszenia międzynarodowego: , PCT/IB95/00452

Wybrane techniki badania białek -proteomika funkcjonalna

IZOMERIA Izomery - związki o takim samym składzie lecz różniące się budową

Bioinformatyka. z sylabusu... (wykład monograficzny) wykład 1. E. Banachowicz. Wykład monograficzny Bioinformatyka.

TECHNIKI ANALIZY RNA TECHNIKI ANALIZY RNA TECHNIKI ANALIZY RNA

Ćwiczenia 1 Wirtualne Klonowanie Prowadzący: mgr inż. Joanna Tymeck-Mulik i mgr Lidia Gaffke. Część teoretyczna:

Związki biologicznie aktywne

6. Z pięciowęglowego cukru prostego, zasady azotowej i reszty kwasu fosforowego, jest zbudowany A. nukleotyd. B. aminokwas. C. enzym. D. wielocukier.

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Inżynieria Genetyczna ćw. 3

Analizy wielkoskalowe w badaniach chromatyny

Związki biologicznie czynne

The Role of Maf1 Protein in trna Processing and Stabilization / Rola białka Maf1 w dojrzewaniu i kontroli stabilności trna

Wprowadzenie. DNA i białka. W uproszczeniu: program działania żywego organizmu zapisany jest w nici DNA i wykonuje się na maszynie białkowej.

ROZPORZĄDZENIE KOMISJI (UE) / z dnia r.

Badanie funkcji genu

Translacja i proteom komórki

(86) Data i numer zgłoszenia międzynarodowego: , PCT/US99/21960 (87) Data i numer publikacji zgłoszenia międzynarodowego:

SYLABUS. Wydział Biologiczno-Rolniczy. Katedra Biochemii i Biologii Komórki

Escherichia coli. System pbad

WYKŁAD: Klasyczny przepływ informacji ( Dogmat) Klasyczny przepływ informacji. Ekspresja genów realizacja informacji zawartej w genach

TATA box. Enhancery. CGCG ekson intron ekson intron ekson CZĘŚĆ KODUJĄCA GENU TERMINATOR. Elementy regulatorowe

(Tekst mający znaczenie dla EOG)

CORAZ BLIŻEJ ISTOTY ŻYCIA WERSJA A. imię i nazwisko :. klasa :.. ilość punktów :.

Zawartość. Wstęp 1. Historia wirusologii. 2. Klasyfikacja wirusów

Biologia Molekularna Podstawy

Badanie funkcji genu

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Klonowanie molekularne Kurs doskonalący. Zakład Geriatrii i Gerontologii CMKP

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

TRANSLACJA II etap ekspresji genów

Zastosowanie metody Lowry ego do oznaczenia białka w cukrze białym

(12) OPIS PATENTOWY. (86) Data i numer zgłoszenia międzynarodowego: , PCT/US97/03313

SCENARIUSZ LEKCJI BIOLOGII Z WYKORZYSTANIEM FILMU KSZTAŁT BIAŁEK.

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Ekspresja genów heterogenicznych w drożdżach Pichia pastoris

Scenariusz lekcji przyrody/biologii (2 jednostki lekcyjne)

1. Biotechnologia i inżynieria genetyczna zagadnienia wstępne 13

ĆWICZENIA Z BIOCHEMII

(86) Data i numer zgłoszenia międzynarodowego: , PCT/EP00/05666 (87) Data i numer publikacji zgłoszenia międzynarodowego:

Transformacja pośrednia składa się z trzech etapów:

Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją).

Hybrydyzacja kwasów nukleinowych

Techniki biologii molekularnej Kod przedmiotu

Metody analizy genomu

BIOSYNTEZA ACYLAZY PENICYLINOWEJ. Ćwiczenia z Mikrobiologii Przemysłowej 2011

Temat: Patentowanie genów analiza obecnych regulacji prawnych oraz alternatywnych rozwiązań w świetle teorii filozoficzno-prawnych prawa patentowego

(86) Data i numer zgłoszenia międzynarodowego: , PCT/CA03/001061

ENZYMY RESTRYKCYJNE ENZYMY RESTRYKCYJNE CZYM RÓŻNIĄ SIĘ POSZCZEGÓLNE ENZYMY? nazewnictwo: EcoRV

Kwasy nukleinowe i białka

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Zaoczne Liceum Ogólnokształcące Pegaz

BUDOWA I FUNKCJA GENOMU LUDZKIEGO

(86) Data i numer zgłoszenia międzynarodowego: , PCT/US02/ (87) Data i numer publikacji zgłoszenia międzynarodowego:

(62) Numer zgłoszenia, z którego nastąpiło wydzielenie: (86) Data i numer zgłoszenia międzynarodowego: , PCT/EP03/009145

TRANSKRYPCJA - I etap ekspresji genów

Czy żywność GMO jest bezpieczna?

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Patentowanie wynalazków biotechnologicznych

Metabolizm białek. Ogólny schemat metabolizmu bialek

Transkrypt:

RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 200157 (21) Numer zgłoszenia: 345579 (13) B1 Urząd Patentowy Rzeczypospolitej Polskiej (22) Data zgłoszenia: 16.06.1999 (86) Data i numer zgłoszenia międzynarodowego: 16.06.1999, PCT/EP99/04171 (87) Data i numer publikacji zgłoszenia międzynarodowego: 23.12.1999, WO99/66028 PCT Gazette nr 51/99 (51) Int.Cl. C12N 15/52 (2006.01) C07K 14/535 (2006.01) C07D 493/00 (2006.01) (54) Wyizolowana cząsteczka kwasu nukleinowego, hybrydowy gen zawierający heterologiczną sekwencję promotora, zrekombinowany wektor, zrekombinowana komórka gospodarza, klon Bac, wyizolowany polipeptyd, sposób heterologicznej ekspresji epotilonu oraz sposób produkcji epotilonu (30) Pierwszeństwo: 18.06.1998,US,09/099,504 24.09.1998,US,60/101,631 05.02.1999,US,60/118,906 (43) Zgłoszenie ogłoszono: 17.12.2001 BUP 26/01 (45) O udzieleniu patentu ogłoszono: 31.12.2008 WUP 12/08 (73) Uprawniony z patentu: NOVARTIS AG,Bazylea,CH (72) Twórca(y) wynalazku: Thomas Schupp,Möhlin,CH James Madison Ligon,Apex,US Istvan Molnar,Durham,US Ross Zirkle,Raleigh,US Jörn Görlach,Durham,US Devon Cyr,Fuguay-Varina,US (74) Pełnomocnik: Sławomira Łazewska, Łazewska i Łazewski (57) Niniejszy wynalazek dotyczy wyizolowanej cząsteczki kwasu nukleinowego, hybrydowego genu zawierającego heterologiczną sekwencję promotora, zrekombinowanego wektora, zrekombinowanej komórki gospodarza, klonu Bac, wyizolowanego polipeptydu, sposobu heterologicznej ekspresji epotilonu oraz sposobu produkcji epotilonu. Bardziej szczegółowo, wynalazek dotyczy poliketydów i genów ich syntezy, a w szczególności izolacji i charakterystyki nowej syntazy poliketydów i genów nierybosomalnej syntetazy peptydowej z Sorangium cellulosum, które są potrzebne do biosyntezy epotilonów A i B. PL 200157 B1

2 PL 200 157 B1 Opis wynalazku Niniejszy wynalazek dotyczy wyizolowanej cząsteczki kwasu nukleinowego, hybrydowego genu zawierającego heterologiczną sekwencję promotora, zrekombinowanego wektora, zrekombinowanej komórki gospodarza, klonu Bac, wyizolowanego polipeptydu, sposobu heterologicznej ekspresji epotilonu oraz sposobu produkcji epotilonu. Bardziej szczegółowo, wynalazek dotyczy poliketydów i genów ich syntezy, a w szczególności izolacji i charakterystyki nowej syntazy poliketydów i genów nierybosomalnej syntetazy peptydowej z Sorangium cellulosum, które są potrzebne do biosyntezy epotilonów A i B. Poliketydy są związkami syntetyzowanymi z dwuwęglowych cegiełek, których β-węgiel zawsze niesie grupę keto, stąd nazwa poliketyd. Te związki obejmują wiele ważnych antybiotyków, związków immunosupresyjnych, czynników do chemioterapii nowotworów i innych związków mających szeroki zakres właściwości biologicznych. Olbrzymia różnorodność strukturalna jest wynikiem różnych długości łańcucha poliketydowego, różnych wprowadzanych łańcuchów bocznych (albo jako część dwuwęglowych jednostek budulcowych albo po utworzeniu szkieletu poliketydowego i stereochemii takich grup. Grupy keto mogą być też zredukowane do hydroksyli, enoili lub całkowicie usunięte. Każda runda dodawania dwóch węgli jest przeprowadzana przez kompleks enzymów zwanych syntazą poliketydów (PKS) w sposób podobny do biosyntezy kwasów tłuszczowych. Geny biosyntetyczne dla coraz większej liczby poliketydów zostały wyizolowane i zsekwencjonowane. Na przykład zobacz amerykańskie dokumenty patentowe nr 5,639,949, 5,693,774, i 5,716,849, wszystkie tu włączone jako odnośniki, które opisują geny biosyntezy sorafanu. Zobacz też, Schupp i wsp., FEMS Microbiology Letters 159: 201-207 (1998) i WO 98/07868, który opisuje geny biosyntezy rifamycyny i amerykański dokument patentowy nr 5,876,991, który opisuje geny biosyntezy tylaktonu, które są wszystkie tu włączone jako odnośniki. Kodowane białka na ogół dzielą się na dwa typy: typ I i typ II. Białka typu I są polifunkcyjne i zawierają z kilka domen katalitycznych przeprowadzających różne etapy enzymatyczne połączonymi razem kowalencyjnie (n.p. PKS dla erytromycyny, sorafenu, rifamycyny i awermektyny (Mac- Neil i wsp., w Industrial Microorganisms: Basic and Applied Molecular Genetics, (red.: Baltz i wsp.), American Society for Microbiology, Washington D.C. str. 245-256 (1993)); podczas gdy białka typu II są monofunkcjonalne (Hutchinson i wsp., w Industrial Microorganisms: Basic and Applied Molecular Genetics, (red.: Baltz i wsp.), American Society for Microbiology, Washington D. C. str. 203-216 (1993)). Dla prostszych poliketydów takich jak aktynorodyna (produkowana przez Streptomyces coelicolor), kilka rund dodawania po dwa węgle jest przeprowadzane iteracyjnie na enzymach PKS kodowanych przez jeden zestaw genów PKS. Przeciwnie, synteza bardziej złożonych związków takich jak erytromycyna i sorafen obejmuje enzymy PKS, które są zorganizowane w moduły gdzie gdy każdy moduł przeprowadza jedną rundę dodawania dwóch węgli (przegląd patrz Hopwood i wsp., w Industrial Microorganisms: Basic and Applied Molecular Genetics, (red.: Baltz i wsp.), American Society for Microbiology, Washington D.C., str. 267-275 (1993)). Złożone poliketydy i metabolity wtórne na ogół mogą zawierać podstruktury pochodzące z aminokwasów raczej niż z prostych kwasów karboksylowych. Inkorporacja tych jednostek jest przeprowadzana przez nierybosomalne syntetazy peptydowe (NRPS). NRPS są multienzymami, które są zorganizowane w moduły. Każdy moduł jest odpowiedzialny za dodanie (i jeśli jest to wymagane dodatkową obróbkę) jednej cegiełki aminokwasu. NRPS aktywują aminokwasy przez tworzenie aminoacyloadenylanów i wyłapują zaktywowane aminokwasy na grupach tiolowych fosfopanteteinylowych grup prostetycznych na domenach białka nośnika peptydylu. Dalej, NRPS modyfikują aminokwasy poprzez epimeryzację, N-metylację lub cyklizację, jeśli jest to potrzebne i katalizują tworzenie wiązań peptydowych między związanymi z enzymem aminokwasami. NRPS są odpowiedzialne za biosyntezę wtórnych metabolitów peptydów takich jak cyklosporyna, mogą dostarczać jednostek zakończenia łańcucha takich jak w rapamycycynie lub tworzyć mieszane systemy z PKS jak w biosyntezie yersiniabaktyny. Epotilony A i B są 16-członowymi makrocyklicznymi poliketydami z jednostką startera pochodzącą od acylocysteiny, które są produkowane przez bakterię Sorangium cellulosum szczep So ce90 (Gerth i wsp., J. Antibiotics 49: 560-563 (1996), włączone tu w postaci odniesienia). Struktura epotilonu A i B gdzie R oznacza wodór (epotilon A) lub metyl (epotilon B) jest następująca:

PL 200 157 B1 3 Epotilony mają wąskie spektrum działania przeciwgrzybowego i szczególnie wykazują wysoką cytotoksyczność w hodowlach komórek zwierząt (zobacz Hafie i wsp., dokument patentowy DE 4138042 (1993), włączony tu jako odnośnik). Bardzo ważne jest, że epotilony imitują efekt biologiczny taksolu, zarówno in vivo, jak i w hodowanych komórkach (Bollag i wsp., Cancer Research 55: 2325- -2333 (1995), włączony tu jako odnośnik. Taksol i taksoter, które stabilizują mikrotubule komórek są czynnikami do chemioterapii nowotworów o znaczącej aktywności w stosunku do różnych ludzkich guzów litych (Rowinsky i wsp., J. Natl. Cancer Inst. 83: 1778-1781 (1991)). Badania kompetycyjne wykazały, że epotilony działają jako inhibitory współzawodniczące wiązania taksolu do mikrotubul, zgodnie z interpretacją, że mają wspólne miejsce wiązania mikrotubul i powinowactwo do mikrotubul jak taksol. Jednak epotilony mają znaczącą przewagę nad taksolem, jako że epotilony wykazują znacznie mniejszy spadek mocy w porównaniu z taksolem w stosunku do linii z opornością na wiele leków (801 lag i wsp. (1995)). Dalej, epotilony są znacznie mniej wydajnie eksportowane z komórki przez glikoproteiny P niż taksol (Gerth i wsp. (1996)). Dodatkowo, zsyntetyzowano kilka analogów epotilonu mających większą aktywność cytotoksyczną w porównaniu z epotilonem A lub epotilonem B jak wykazano przez ich zwiększoną zdolność do indukcji polimeryzacji i stabilizacji mikrotubul (WO 98/25929 włączony tu w postaci odniesienia). Mimo oczekiwań w stosunku do epotilonów jako czynników przeciwnowotworowych, obecnie problemy dotyczące produkcji tych związków ograniczają ich potencjał handlowy. Związki są zbyt skomplikowane do syntezy chemicznej na skalę przemysłową i muszą być produkowane przez fermentację. Techniki do manipulacji genetycznej miksobakterii takich jak Sorangium cellulosum są opisane w amerykańskim dokumencie patentowym nr 5,686,295, włączonym tu w postaci odniesienia. Jednak jest wiadomo, że bardzo trudno jest prowadzić fermentację Sorangium cellulosum, tak więc poziomy produkcji epotilonów są niskie. Zrekombinowana produkcja epotilonów w gospodarzach heterologicznych, którzy są bardziej podatni na fermentację mogłaby rozwiązać obecne problemy. Jednak geny kodujące polipeptydy odpowiedzialne za biosyntezę epotilonu nie były dotychczas izolowane. Co więcej, szczep, który produkuje epotilony, tzn. So ce90, także produkuje przynajmniej jeden dodatkowy poliketyd, spirangien, co jak można oczekiwać bardzo by utrudniało izolację genów w szczególności odpowiedzialnych za biosyntezę epotilonu. Tak więc ze względu na powyższe jednym celem niniejszego wynalazku jest izolacja genów, które biorą udział w syntezie epotilonów, w szczególności genów, które biorą udział w syntezie epotilonów A i B u myksobakterii grupy Sorangium/Polyangium, tzn. Sorangium cellulosum szczep So ce90. Dalszym celem wynalazku jest dostarczenie sposobu zrekombinowanej produkcji epotilonów do stosowania w formułach przeciwnowotworowych. Przedmiotem wynalazku jest wyizolowana cząsteczka kwasu nukleinowego zawierająca sekwencję nukleotydów, która koduje przynajmniej jeden polipeptyd biorący udział w biosyntezie epotilonu, charakteryzująca się tym, że ten polipeptyd zawiera sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: SEQ ID NO:2, aminokwasów 11-437 SEQ ID NO:2, aminokwasów 543-864 SEQ ID NO:2, aminokwasów 974-1273 SEQ ID NO:2, aminokwasów 1314-1385 SEQ ID NO:2, SEQ ID NO:3, aminokwasów 72-81 SEQ ID NO:3, aminokwasów 118-125 SEQ ID NO:3, aminokwasów 199-212 SEQ ID NO:3, aminokwasów 353-363 SEQ ID NO:3, aminokwasów 549-565 SEQ ID NO:3, aminokwasów 588-603 SEQ ID NO:3, aminokwasów 669-684 SEQ ID NO:3, aminokwasów 815-821 SEQ ID NO:3, aminokwasów 868-892 SEQ ID NO:3, aminokwasów 903-912 SEQ ID NO:3, aminokwasów 918-940 SEQ ID NO:3, aminokwasów 1268-1274 SEQ ID NO:3, aminokwasów 1285-1297 SEQ ID NO:3, aminokwasów 973-1256 SEQ ID NO:3, aminokwasów 1344-1351 SEQ ID NO:3, SEQ ID NO:4, aminokwasów 7-432 SEQ ID NO:4, aminokwasów 539- -859 SEQ ID NO:4, aminokwasów 869-1037 SEQ ID NO:4, aminokwasów 1439-1684 SEQ ID NO:4, aminokwasów 1722-1792 SEQ ID NO:4, SEQ ID NO:5, aminokwasów 39-457 SEQ ID NO:5, aminokwasów 563-884 SEQ ID NO:5, aminokwasów 1147-1399 SEQ ID NO:5, aminokwasów 1434-1506 SEQ ID NO:5, aminokwasów 1524-1950 SEQ ID NO:5, aminokwasów 2056-2377 SEQ ID NO:5, ami-

4 PL 200 157 B1 nokwasów 2645-2895 SEQ ID NO:5, aminokwasów 2932-3005 SEQ ID NO:5, aminokwasów 3024- -3449 SEQ ID NO:5, aminokwasów 3555-3876 SEQ ID NO:5, aminokwasów 3886-4048 SEQ ID NO:5, aminokwasów 4433-4719 SEQ ID NO:5, aminokwasów 4729-4974 SEQ ID NO:5, aminokwasów 5010-5082 SEQ ID NO:5, aminokwasów 5103-5525 SEQ ID NO:5, aminokwasów 5631-5951 SEQ ID NO:5, aminokwasów 5964-6132 SEQ ED NO:5, aminokwasów 6542-6837 SEQ ID NO:5, aminokwasów 6857-7101 SEQ ID NO:5, aminokwasów 7140-7211 SEQ ID NO:5, SEQ ID NO:6, aminokwasów 35-454 SEQ ID NO:6, aminokwasów 561-881 SEQ ID NO:6, aminokwasów 1143-1393 SEQ ID NO:6, aminokwasów 1430-1503 SEQ ID NO:6, aminokwasów 1522-1946 SEQ ID NO:6, aminokwasów 2053-2373 SEQ ID NO:6, aminokwasów 2383-2551 SEQ ID NO:6, aminokwasów 2671- -3045 SEQ ID NO:6, aminokwasów 3392-3636 SEQ ID NO:6 aminokwasów 3673-3745 SEQ ID NO:6, SEQ ID NO:7, aminokwasów 32-450 SEQ ID NO:7, aminokwasów 556-877 SEQ ID NO:7, aminokwasów 887-1051 SEQ ID NO:7, aminokwasów 1478-1790 SEQ ID NO:7, aminokwasów 1810-2055 SEQ ID NO:7, aminokwasów 2093-2164 SEQ ID NO:7, aminokwasów 2165-2439 SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:11 i SEQ ID NO:22. Korzystnie, polipeptyd zawiera sekwencję aminokwasów wybraną z grupy złożonej z: SEQ ID NO:2, aminokwasów 11-437 SEQ ID NO:2, aminokwasów 543-864 SEQ ID NO:2, aminokwasów 974- -1273 SEQ ID NO:2, aminokwasów 1314-1385 SEQ ID NO:2, SEQ ID NO:3, aminokwasów 72-81 SEQ ID NO:3, aminokwasów 118-125 SEQ ID NO:3, aminokwasów 199-212 SEQ ID NO:3, aminokwasów 353-363 SEQ ID NO:3, aminokwasów 549-565 SEQ ID NO:3, aminokwasów 588-603 SEQ ID NO:3, aminokwasów 669-684 SEQ ID NO:3, aminokwasów 815-821 SEQ ID NO:3, aminokwasów 868-892 SEQ ID NO:3, aminokwasów 903-912 SEQ ID NO:3, aminokwasów 918-940 SEQ ID NO:3, aminokwasów 1268-1274 SEQ ID NO:3, aminokwasów 1285-1297 SEQ ID NO:3, aminokwasów 973- -1256 SEQ ID NO:3, aminokwasów 1344-1351 SEQ ID NO:3, SEQ ID NO:4, aminokwasów 7-432 i SEQ ID NO:4, aminokwasów 539-859 SEQ ID NO:4, aminokwasów 869-1037 SEQ ID NO:4, aminokwasów 1439-1684 SEQ ID NO:4, aminokwasów 1722-1792 SEQ ID NO:4, SEQ ID NO:5, aminokwasów 39-457 SEQ ID NO:5, aminokwasów 563-884 SEQ ID NO:5, aminokwasów 1147-1399 SEQ ID NO:5, aminokwasów 1434-1506 SEQ ID NO:5, aminokwasów 1524-1950 SEQ ID NO:5, aminokwasów 2056-2377 SEQ ID NO:5, aminokwasów 2645-2895 SEQ ID NO:5, aminokwasów 2932-3005 SEQ ID NO:5, aminokwasów 3024-3449 SEQ ID NO:5, aminokwasów 3555-3876 SEQ ID NO:5, aminokwasów 3886-4048 SEQ ID NO:5, aminokwasów 4433-4719 SEQ ID NO:5, aminokwasów 4729- -4974 SEQ ID NO:5, aminokwasów 5010-5082 SEQ ID NO:5, aminokwasów 5103-5525 SEQ ID NO:5, aminokwasów 5631-5951 SEQ ID NO:5, aminokwasów 5964-6132 SEQ ID NO:5, aminokwasów 6542-6837 SEQ ID NO:5, aminokwasów 6857-7101 SEQ ID NO:5, aminokwasów 7140-7211 SEQ ID NO:5, SEQ ID NO:6, aminokwasów 35-454 SEQ ID NO:6, aminokwasów 561-881 SEQ ID NO:6, aminokwasów 1143-1393 SEQ ID NO:6, aminokwasów 1430-1503 SEQ ID NO:6, aminokwasów 1522-1946 SEQ ID NO:6, aminokwasów 2053-2373 SEQ ID NO:6, aminokwasów 2383-2551 SEQ ID NO:6, aminokwasów 2671-3045 SEQ ID NO:6, aminokwasów 3392-3636 SEQ BD NO:6, aminokwasów 3673-3745 SEQ ID NO:6, SEQ ID NO:7, aminokwasów 32-450 SEQ ID NO:7, aminokwasów 556-877 SEQ ID NO:7, aminokwasów 887-1051 SEQ ID NO:7, aminokwasów 1478-1790 SEQ ID NO:7, aminokwasów 1810-2055 SEQ ID NO:7, aminokwasów 2093-2164 SEQ ID NO:7, aminokwasów 2165-2439 SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:11 i SEQ ID NO:22. W innym korzystnym wariancie wynalazku, sekwencja nukleotydów jest zasadniczo podobna do sekwencji nukleotydów wybranej z grupy złożonej z sekwencji komplementarnych do nukleotydów 1900-3171 SEQ ID NO:1, nukleotydów 3415-5556 SEQ ID NO:1, nukleotydów 7610-11875 SEQ ID NO:1, nukleotydów 7643-8920 SEQ ID NO:1, nukleotydów 9236-10201 SEQ ID NO:1, nukleotydów 10529-11428 SEQ ID NO:1, nukleotydów 11549-11764 SEQ ID NO:1, nukleotydów 11872-16104 SEQ ID NO:1, nukleotydów 12085-12114 SEQ ID NO:1, nukleotydów 12223-12246 SEQ ID NO:1, nukleotydów 12466-12507 SEQ ID NO:1, nukleotydów 12928-12960 SEQ ID NO:1, nukleotydów 13516-13566 SEQ ID NO:1, nukleotydów 13633-13680 SEQ ID NO:1, nukleotydów 13876-13923 SEQ ID NO:1, nukleotydów 14313-14334 SEQ ID NO:1, nukleotydów 14473-14547 SEQ ID NO:1, nukleotydów 14578-14607 SEQ ID NO:1, nukleotydów 14623-14692 SEQ ID NO:1, nukleotydów 15673-15693 SEQ ID NO:1, nukleotydów 15724-15762 SEQ ID NO:1, nukleotydów 14788-15639 SEQ ID NO:1, nukleotydów 15901-15924 SEQ ID NO:1, nukleotydów 16251-21749 SEQ ID NO:1, nukleotydów 16269-17546 SEQ ID NO:1, nukleotydów 17865-18827 SEQ ID NO:1, nukleotydów 18855-19361 SEQ ID NO:1, nukleotydów 20565-21302 SEQ ID NO:1, nukleotydów 21414-21626 SEQ ID NO:1, nukleotydów 21746-43519 SEQ ID NO:1, nukleotydów 21860-23116 SEQ ID NO:1,

PL 200 157 B1 5 nukleotydów 23431-24397 SEQ ID NO:1, nukleotydów 25184-25942 SEQ ID NO:1, nukleotydów 26045-26263 SEQ ID NO:1, nukleotydów 26318-27595 SEQ ID NO:1, nukleotydów 27911-28876 SEQ ID NO:1, nukleotydów 29678-30429 SEQ ID, NO:1, nukleotydów 30539-30759 SEQ ID NO:1, nukleotydów 30815-32092 SEQ ID NO:1, nukleotydów 32408-33373 SEQ ID NO:1, nukleotydów 33401-33889 SEQ ID NO:1, nukleotydów 35042-35902 SEQ ID NO:1, nukleotydów 35930-36667 SEQ ID NO:1, nukleotydów 36773-36991 SEQ ID NO:1, nukleotydów 37052-38320 SEQ ID NO:1, nukleotydów 38636-39598 SEQ ID NO:1, nukleotydów 39635-40141 SEQ ID NO:1, nukleotydów 41369-42256 SEQ ID NO:1, nukleotydów 42314-43048 SEQ ID NO:1, nukleotydów 43163-43378 SEQ ID NO:1, nukleotydów 43524-54920 SEQ ID NO:1, nukleotydów 43626-44885 SEQ ID NO:1, nukleotydów 45204-46166 SEQ ID NO:1, nukleotydów 46950-47702 SEQ ID NO:1, nukleotydów 47811-48032 SEQ ID NO:1, nukleotydów 48087-49361 SEQ ID NO:1, nukleotydów 49680-50642 SEQ ID NO:1, nukleotydów 50670-51176 SEQ ID NO:1, nukleotydów 51534-52657 SEQ ID NO:1, nukleotydów 53697-54431 SEQ ID NO:1, nukleotydów 54540-54758 SEQ ID NO:1, nukleotydów 54935-62254 SEQ ID NO:1, nukleotydów 55028-56284 SEQ ID NO:1, nukleotydów 56600-57565 SEQ ID NO:1, nukleotydów 57593-58087 SEQ ID NO:1, nukleotydów 59366-60304 SEQ ID NO:1, nukleotydów 60362-61099 SEQ ID NO:1, nukleotydów 61211-61426 SEQ ID NO:1, nukleotydów 61427-62254 SEQ ID NO:1, nukleotydów 62369-63628 SEQ ID NO:1, nukleotydów 67334-68251 SEQ ID NO:1 i nukleotydów 1-68750 SEQ ID NO:1. W jeszcze innym korzystnym wariancie wynalazku, sekwencja nukleotydów jest wybrana z grupy złożonej z sekwencji komplementarnych do nukleotydów 1900-3171 SEQ ID NO:1, nukleotydów 3415-5556 SEQ ID NO:1, nukleotydów 7610-11875 SEQ ID NO:1, nukleotydów 7643-8920 SEQ ID NO:1, nukleotydów 9236-10201 SEQ ID NO:1, nukleotydów 10529-11428 SEQ ID NO:1, nukleotydów 11549-11764 SEQ ID NO:1, nukleotydów 11872-16104 SEQ ID NO:1, nukleotydów 12085-12114 SEQ ID NO:1, nukleotydów 12223-12246 SEQ ID NO:1, nukleotydów 12466-12507 SEQ ID NO:1, nukleotydów 12928-12960 SEQ ID NO:1, nukleotydów 13516-13566 SEQ ID NO:1, nukleotydów 13633-13680 SEQ ID NO:1, nukleotydów 13876-13923 SEQ ID NO:1, nukleotydów 14313-14334 SEQ ID NO:1, nukleotydów 14473-14547 SEQ ID NO:1, nukleotydów 14578-14607 SEQ ID NO:1, nukleotydów 14623-14692 SEQ ID NO:1, nukleotydów 15673-15693 SEQ ID NO:1, nukleotydów 15724-15762 SEQ ID NO:1, nukleotydów 14788-15639 SEQ ID NO:1, nukleotydów 15901-15924 SEQ ID NO:1, nukleotydów 16251-21749 SEQ ID NO:1, nukleotydów 16269-17546 SEQ ID NO:1, nukleotydów 17865-18827 SEQ ID NO:1, nukleotydów 18855-19361 SEQ ID NO:1, nukleotydów 20565-21302 SEQ ID NO:1, nukleotydów 21414-21626 SEQ ID NO:1, nukleotydów 21746-43519 SEQ ID NO:1, nukleotydów 21860-23116 SEQ ID NO:1, nukleotydów 23431-24397 SEQ ID NO:1, nukleotydów 25184-25942 SEQ ID NO:1, nukleotydów 26045-26263 SEQ ID NO:1, nukleotydów 26318-27595 SEQ ID NO:1, nukleotydów 27911-28876 SEQ ID NO:1, nukleotydów 29678-30429 SEQ ID NO:1, nukleotydów 30539-30759 SEQ ID NO:1, nukleotydów 30815-32092 SEQ ID NO:1, nukleotydów 32408-33373 SEQ ID NO:1, nukleotydów 33401-33889 SEQ ID NO:1, nukleotydów 35042-35902 SEQ ID NO:1, nukleotydów 35930-36667 SEQ ID NO:1, nukleotydów 36773-36991 SEQ ID NO:1, nukleotydów 37052-38320 SEQ ID NO:1, nukleotydów 38636-39598 SEQ ID NO:1, nukleotydów 39635-40141 SEQ ID NO:1, nukleotydów 41369-42256 SEQ ID NO:1, nukleotydów 42314-43048 SEQ ID NO:1, nukleotydów 43163-43378 SEQ ID NO:1, nukleotydów 43524-54920 SEQ ID NO:1, nukleotydów 43626-44885 SEQ ID NO:1, nukleotydów 45204-46166 SEQ ID NO:1, nukleotydów 46950-47702 SEQ ID NO:1, nukleotydów 47811-48032 SEQ ID NO:1, nukleotydów 48087-49361 SEQ ID NO:1, nukleotydów 49680-50642 SEQ ID NO:1, nukleotydów 50670-51176 SEQ ID NO:1, nukleotydów 51534-52657 SEQ ID NO:1, nukleotydów 53697-54431 SEQ ID NO:1, nukleotydów 54540-54758 SEQ ID NO:1, nukleotydów 54935-62254 SEQ ID NO:1, nukleotydów 55028-56284 SEQ ID NO:1, nukleotydów 56600-57565 SEQ ID NO:1, nukleotydów 57593-58087 SEQ ID NO:1, nukleotydów 59366-60304 SEQ ID NO:1, nukleotydów 60362-61099 SEQ ID NO:1, nukleotydów 61211-61426 SEQ ID NO:1, nukleotydów 61427-62254 SEQ ID NO:1, nukleotydów 62369-63628 SEQ ID NO:1, nukleotydów 67334-68251 SEQ ID NO:1 i nukleotydów 1-68750 SEQ ID NO:1. Korzystnie, wyizolowana cząsteczka kwasu nukleinowego zawiera sekwencję nukleotydów kodującą co najmniej jedną domenę syntazy epotilonu, przy czym ta domena syntazy epotilonu jest domeną β-ketoacylo syntazy zawierającą sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: aminokwasów 11-437 SEQ ID NO:2, aminokwasów 7-432 SEQ ID NO:4, aminokwasów 39-457 SEQ ID NO:5, aminokwasów 1524-1950 SEQ ID NO:5, amino-

6 PL 200 157 B1 kwasów 3024-3449 SEQ ID NO:5, aminokwasów 5103-5525 SEQ ID NO:5, aminokwasów 35-454 SEQ ID NO:6, aminokwasów 1522-1946 SEQ ID NO: 6 i aminokwasów 32-450 SEQ ID NO:7. Korzystnie, sekwencja nukleotydów jest zasadniczo podobna do sekwencji nukleotydów wybranej z grupy złożonej z: nukleotydów 7643-8920 SEQ ID NO:1, nukleotydów 16269-17546 SEQ ID NO:1, nukleotydów 21860-23116 SEQ ID NO:1, nukleotydów 26318-27595 SEQ ID NO:1, nukleotydów 30815-32092 SEQ ID NO:1, nukleotydów 37052-38320 SEQ ID NO:1, nukleotydów 43626-44885 SEQ ID NO:1, nukleotydów 48087-49361 SEQ ID NO:1 i nukleotydów 55028-56284 SEQ ID NO:1. W innym, korzystnym wariancie wynalazku, wyizolowana cząsteczka kwasu nukleinowego zawiera sekwencję nukleotydów kodującą co najmniej jedną domenę syntazy epotilonu, przy czym ta domena syntazy epotilonu jest domeną acylotransferazy zawierającą sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: aminokwasów 543-864 SEQ ID NO:2, aminokwasów 539-859 SEQ ID NO:4, aminokwasów 563-884 SEQ ID NO:5, aminokwasów 2056-2377 SEQ ID NO:5, aminokwasów 3555-3876 SEQ ID NO:5, aminokwasów 5631-5951 SEQ ID NO:5, aminokwasów 561-881 SEQ ID NO:6, aminokwasów 2053-2373 SEQ ID NO:6 i aminokwasów 556-877 SEQ ID NO:7. Korzystnie, sekwencja nukleotydów jest zasadniczo podobna do sekwencji nukleotydów wybranej z grupy złożonej z: nukleotydów 9236-10201 SEQ ID NO:1, nukleotydów 17865-18827 SEQ ID NO:1, nukleotydów 23431-24397 SEQ ID NO:1, nukleotydów 27911-28876 SEQ ID NO:1, nukleotydów 32408-33373 SEQ ID NO:1, nukleotydów 38636-39598 SEQ ID NO:1, nukleotydów 45204-46166 SEQ ID NO:1, nukleotydów 49680-50642 SEQ ID NO:1 i nukleotydów 56600-57565 SEQ ID NO:1. W jeszcze innym, korzystnym wariancie wynalazku, wyizolowana cząsteczka kwasu nukleinowego zawiera sekwencję nukleotydów kodującą co najmniej jedną domenę syntazy epotilonu, przy czym domena syntazy epotilonu jest domeną reduktazy enoilu zawierającą sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: aminokwasów 974- -1273 SEQ ID NO:2, aminokwasów 4433-4719 SEQ ID NO:5, aminokwasów 6542-6837 SEQ ID NO:5 i aminokwasów 1478-1790 SEQ ID NO:7. Korzystnie, sekwencja nukleotydów jest zasadniczo podobna do sekwencji nukleotydów wybranej z grupy złożonej z: nukleotydów 10529-11428 SEQ ID NO:1, nukleotydów 35042-35902 SEQ ID NO:1, nukleotydów 41369-42256 SEQ ID NO:1 i nukleotydów 59366-60304 SEQ ID NO:1. W kolejnym, korzystnym wariancie wynalazku, wyizolowana cząsteczka kwasu nukleinowego zawiera sekwencję nukleotydów kodującą co najmniej jedną domenę syntazy epotilonu, przy czym domena syntazy epotilonu jest domeną białka przenoszącego grupę acylową zawierającą sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: aminokwasów 1314-1385 SEQ ID NO:2, aminokwasów 1722-1792 SEQ ID NO:4, aminokwasów 1434-1506 SEQ ID NO:5, aminokwasów 2932-3005 SEQ ID NO:5, aminokwasów 5010-5082 SEQ ID NO:5, aminokwasów 7140-7211 SEQ ID NO:5, aminokwasów 1430-1503 SEQ ID NO:6, aminokwasów 3673- -3745 SEQ ID NO:6 i aminokwasów 2093-2164 SEQ ID NO:7. Korzystnie, wyizolowana cząsteczka kwasu nukleinowego sekwencja nukleotydów jest zasadniczo podobna do sekwencji nukleotydów wybranej z grupy złożonej z: nukleotydów 11549-11764 SEQ ID NO:1, nukleotydów 21414-21626 SEQ ID NO:1, nukleotydów 26045-26263 SEQ ID NO:1, nukleotydów 30539-30759 SEQ ID NO:1, nukleotydów 36773-36991 SEQ ID NO:1, nukleotydów 43163- -43378 SEQ ID NO:1, nukleotydów 47811-48032 SEQ ID NO:1, nukleotydów 54540-54758 SEQ ID NO:1 i nukleotydów 61211-61426 SEQ ID NO:1. W innym, korzystnym wariancie wynalazku, wyizolowana cząsteczka kwasu nukleinowego zawiera sekwencję nukleotydów kodującą co najmniej jedną domenę syntazy epotilonu, przy czym domena syntazy epotilonu jest domeną dehydratazy zawierającą sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: aminokwasów 869-1037 SEQ ID NO:4, aminokwasów 3886-4048 SEQ ID NO:5, aminokwasów 5964-6132 SEQ ID NO:5, aminokwasów 2383-2551 SEQ ID NO:6 i aminokwasów 887-1051 SEQ ID NO:7. Korzystnie, sekwencja nukleotydów jest zasadniczo podobna do sekwencji nukleotydów wybranej z grupy złożonej z: nukleotydów 18855-19361 SEQ ID NO:1, nukleotydów 33401-33889 SEQ ID NO:1, nukleotydów 39635-40141 SEQ ID NO:1, nukleotydów 50670-51176 SEQ ID NO:1 i nukleotydów 57593-58087 SEQ ID NO:1. W kolejnym, korzystnym wariancie wynalazku, wyizolowana cząsteczka kwasu nukleinowego zawiera sekwencję nukleotydów kodującą co najmniej jedną domenę syntazy epotilonu, przy czym domena syntazy epotilonu jest domeną β-ketoreduktazy zawierającą sekwencję aminokwasów zasad-

PL 200 157 B1 7 niczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: aminokwasów 1439-1684 SEQ ID NO:4, aminokwasów 1147-1399 SEQ ID NO:5, aminokwasów 2645-2895 SEQ ID NO:5, aminokwasów 4729-4974 SEQ ID NO:5, aminokwasów 6857-7101 SEQ ID NO:5, aminokwasów 1143- -1393 SEQ ID NO:6, aminokwasów 3392-3636 SEQ ID NO:6 i aminokwasów 1810-2055 SEQ ID NO:7. Korzystnie, sekwencja nukleotydów jest zasadniczo podobna do sekwencji nukleotydów wybranej z grupy złożonej z: nukleotydów 20565-21302 SEQ ID NO:1, nukleotydów 25184-25942 SEQ ID NO:1, nukleotydów 29678-30429 SEQ ID NO:1, nukleotydów 35930-36667 SEQ ID NO:1, nukleotydów 42314-43048 SEQ ID NO:1, nukleotydów 46950-47702 SEQ ID NO:1, nukleotydów 53697-54431 SEQ ID NO:1 i nukleotydów 60362-61099 SEQ ID NO:1. W jeszcze innym, korzystnym wariancie wynalazku, wyizolowana cząsteczka kwasu nukleinowego zawiera sekwencję nukleotydów kodującą co najmniej jedną domenę syntazy epotilonu, przy czym domena syntazy jest domeną metylotransferazy zawierającą sekwencję aminokwasów zasadniczo podobną do aminokwasów 2671-3045 SEQ ID NO:6. Korzystnie, sekwencja nukleotydów jest zasadniczo podobna to nukleotydów 51534-52657 SEQ ID NO:1. W innym, korzystnym wariancie wynalazku, wyizolowana cząsteczka kwasu nukleinowego zawiera sekwencję nukleotydów kodującą co najmniej jedną domenę syntazy epotilonu, przy czym domena syntazy epotilonu jest domeną tioesterazy zawierającą sekwencję aminokwasów zasadniczo podobną do aminokwasów 2165-2439 SEQ ID NO:7. Korzystnie, sekwencja nukleotydów jest zasadniczo podobna do nukleotydów 61427-62254 SEQ ID NO:1. W kolejnym, korzystnym wariancie wynalazku, wyizolowana cząsteczka kwasu nukleinowego zawiera sekwencję nukleotydów, która koduje nierybosomalną syntetazę peptydową, przy czym, nierybosomalna syntetaza peptydowa zawiera sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: SEQ ID NO:3, aminokwasów 72-81 SEQ ID NO:3, aminokwasów 118-125 SEQ ID NO:3, aminokwasów 199-212 SEQ ID NO:3, aminokwasów 353-363 SEQ ID NO:3, aminokwasów 549-565 SEQ ID NO:3, aminokwasów 588-603 SEQ ID NO:3, aminokwasów 669-684 SEQ ID NO:3, aminokwasów 815-821 SEQ ID NO:3, aminokwasów 868-892 SEQ ID NO:3, aminokwasów 903-912 SEQ ID NO:3, aminokwasów 918-940 SEQ ID NO:3, aminokwasów 1268-1274 SEQ ID NO:3, aminokwasów 1285-1297 SEQ ID NO:3, aminokwasów 973-1256 SEQ ID NO:3 i aminokwasów 1344-1351 SEQ ID NO:3. Korzystnie, sekwencja nukleotydów jest zasadniczo podobna do sekwencji nukleotydów wybranej z grupy złożonej z: nukleotydów 11872-16104 SEQ ID NO:1, nukleotydów 12085-12114 SEQ ID NO:1, nukleotydów 12223-12246 SEQ ID NO:1, nukleotydów 12466-12507 SEQ ID NO:1, nukleotydów 12928-12960 SEQ ID NO:1, nukleotydów 13516-13566 SEQ ID NO:1, nukleotydów 13633-13680 SEQ ID NO:1, nukleotydów 13876-13923 SEQ ID NO:1, nukleotydów 14313-14334 SEQ ID NO:1, nukleotydów 14473-14547 SEQ ID NO:1, nukleotydów 14578-14607 SEQ ID NO:1, nukleotydów 14623-14692 SEQ ID NO:1, nukleotydów 15673-15693 SEQ ID NO:1, nukleotydów 15724-15762 SEQ ID NO:1, nukleotydów 14788-15639 SEQ ID NO:1 i nukleotydów 15901-15924 SEQ ID NO:1. Korzystnie, sekwencja nukleotydowa izolowana jest z miksobakterii. Korzystnie, miksobakteria stanowi Sorangium cellulosum. Przedmiotem wynalazku jest również, hybrydowy gen zawierający heterologiczną sekwencję promotora charakteryzujący się tym, że heterologiczna sekwencja promotora jest funkcjonalnie połączona z cząsteczką kwasu nukleinowego według wynalazku. Przedmiotem wynalazku jest także zrekombinowany wektor charakteryzujący się tym, że zawiera hybrydowy gen według wynalazku. Kolejnym przedmiotem wynalazku jest zrekombinowana komórka gospodarza, charakteryzująca się tym, że zawiera hybrydowy gen według wynalazku. Korzystnie, zrekombinowana komórka gospodarza jest bakterią. Korzystnie, zrekombinowana komórka gospodarza należy do promieniowców. Korzystnie, zrekombinowana komórka gospodarza należy do rodzaju Streptomyces. Przedmiotem wynalazku jest także klon Bac charakteryzujący się tym, że zawiera cząsteczkę kwasu nukleinowego według wynalazku. Kolejnym przedmiotem wynalazku jest wyizolowany polipeptyd charakteryzujący się tym, że zawiera sekwencję aminokwasów, w skład której wchodzi domena syntazy epotilonu.

8 PL 200 157 B1 Korzystnie, domena syntazy epotilonu jest domeną β-ketoacylo syntazy zawierającą sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej grupy złożonej z: aminokwasów 11-437 SEQ ID NO:2, aminokwasów 7-432 SEQ ID NO:4, aminokwasów 39-457 SEQ ID NO:5, aminokwasów 1524-1950 SEQ ID NO:5, aminokwasów 3024-3449 SEQ ID NO:5, aminokwasów 5103-5525 SEQ ID NO:5, aminokwasów 35-454 SEQ ID NO:6, aminokwasów 1522-1946 SEQ ID NO:6 i aminokwasów 32-450 SEQ ID NO:7. W innym korzystnym wariancie wynalazku, domena syntazy epotilonu jest domeną acylotransferazy zawierającą sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: aminokwasów 543-864 SEQ ID NO:2, aminokwasów 539-859 SEQ ID NO:4, aminokwasów 563-884 SEQ ID NO:5, aminokwasów 2056-2377 SEQ ID NO:5, aminokwasów 3555- -3876 SEQ ID NO:5, aminokwasów 5631-5951 SEQ ID NO:5, aminokwasów 561-881 SEQ ID NO:6, aminokwasów 2053-2373 SEQ ID NO:6 i aminokwasów 556-877 SEQ ID NO:7. W jeszcze innym korzystnym wariancie wynalazku, domena syntazy epotilonu jest domeną reduktazy enoilu zawierającą sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: aminokwasów 974-1273 SEQ ID NO:2, aminokwasów 4433-4719 SEQ ID NO:5, aminokwasów 6542-6837 SEQ ID NO:5 i aminokwasów 1478-1790 SEQ ID NO:7. W kolejnym korzystnym wariancie wynalazku domena syntazy enoilu jest domeną białka przenoszącego grupę acylową, przy czym polipeptyd zawiera sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: aminokwasów 1314-1385 SEQ ID NO:2, aminokwasów 1722-1792 SEQ ID NO:4, aminokwasów 1434-1506 SEQ ID NO:5, aminokwasów 2932-3005 SEQ ID NO:5, aminokwasów 5010-5082 SEQ ID NO:5, aminokwasów 7140-7211 SEQ ID NO:5, aminokwasów 1430-1503 SEQ ID NO:6, aminokwasów 3673-3745 SEQ ID NO:6 i aminokwasów 2093-2164 SEQ ID NO:7. W innym korzystnym wariancie wynalazku, domena syntazy epotilonu jest domeną dehydratazy, zawierającą sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: aminokwasów 869-1037 SEQ ID NO:4, aminokwasów 3886-4048 SEQ ID NO:5, aminokwasów 5964-6132 SEQ ID NO:5, aminokwasów 2383-2551 SEQ ID NO:6 i aminokwasów 887-1051 SEQ ID NO:7. W kolejnym, korzystnym wariancie wynalazku domena syntazy epotilonu jest domeną β-ketoreduktazy zawierającą sekwencję aminokwasów zasadniczo podobną do sekwencji aminokwasów wybranej z grupy złożonej z: aminokwasów 1439-1684 SEQ ID NO:4, aminokwasów 1147-1399 SEQ ID NO:5, aminokwasów 2645-2895 SEQ ID NO:5, aminokwasów 4729-4974 SEQ ID NO:5, aminokwasów 6857-7101 SEQ ID NO:5, aminokwasów 1143-1393 SEQ ID NO:6, aminokwasów 3392- -3636 SEQ ID NO:6 i aminokwasów 1810-2055 SEQ ID NO:7. W innym korzystnym wariancie wynalazku, domena syntazy epotilonu jest domeną metylotransferazy zawierającą sekwencję aminokwasów zasadniczo podobną do aminokwasów 2671-3045 SEQ ID NO:6. W jeszcze innym korzystnym wariancie wynalazku domena syntazy epotilonu jest domeną tioesterazy zawierającą sekwencję aminokwasów zasadniczo podobną do aminokwasów 2165-2439 SEQ ID NO:7. Przedmiotem wynalazku jest ponadto, sposób heterologicznej ekspresji epotilonu w zrekombinowanym gospodarzu, charakteryzujący się tym, że obejmuje: (a) wprowadzenie hybrydowego genu według wynalazku do gospodarza; i (b) hodowlę gospodarza w warunkach, które pozwalają na biosyntezę epotilonu u gospodarza. Ponadto, przedmiotem wynalazku jest, sposób produkcji epotilonu, charakteryzujący się tym, że obejmuje: (a) ekspresję epotilonu w zrekombinowanym gospodarzu sposobem według wynalazku; i (b) ekstrakcję epotilonu ze zrekombinowanego gospodarza. Przedmiotowy wynalazek nieoczekiwanie przezwycięża trudności podane powyżej by po raz pierwszy dostarczyć cząsteczkę kwasu nukleinowego zawierającą sekwencję nukleotydów, która koduje przynajmniej jeden polipeptyd biorący udział w biosyntezie epotilonu. W korzystnej postaci sekwencja nukleotydów jest izolowana z gatunku należącego do miksobakterii, najbardziej korzystnie Sorangium cellulosum. W korzystnej postaci zrekombinowana komórka gospodarza jest bakterią należącą do rzędu promieniowców (Actinomycetales), i w bardziej korzystnej postaci zrekombinowana komórka gospodarza jest szczepem Streptomyces, jednakże w innych wariantach zrekombinowana komórka gospodarza jest dowolną inną bakterią podatną na fermentacje taką jak Pseudomonas lub E. coli.

PL 200 157 B1 9 Korzystnie klonem Bac jest klon pepo15. Niniejszy wynalazek dotyczy sposobów dla zrekombinowanej produkcji poliketydów takich jak epotilony w ilościach dostatecznie dużych by umożliwić ich oczyszczanie i zastosowanie w farmaceutycznych preparatach takich jak do leczenia raka. Specyficzną korzyścią tych sposobów wytwarzania jest chiralność produkowanych cząsteczek, poza tym produkcja w organizmach transgenicznych unika wytwarzania populacji mieszanin racemicznych, wśród których niektóre enancjomery mogą mieć obniżone aktywności. Inne aspekty i korzyści niniejszego wynalazku staną się ewidentne dla specjalistów ze studiowania następującego opisu wynalazku i nieograniczających przykładów. W opisie niniejszego wynalazku będą stosowane następujące określenia i mają być zdefiniowane jak podano poniżej: Określenia zasocjowane z" / "funkcjonalnie połączone" dotyczy dwóch sekwencji DNA, które są powiązane fizycznie lub funkcjonalnie. Na przykład promotor lub regulacyjna sekwencja DNA jest określana jako "zasocjowana z" sekwencją DNA, która koduje RNA lub białko jeśli dwie sekwencje są połączone funkcjonalnie lub położone tak, że regulacyjna sekwencja DNA będzie wpływała na poziom ekspresji kodującej lub strukturalnej sekwencji DNA. Określenie hybrydowy gen" oznacza zrekombinowaną sekwencję DNA, w której promotor lub regulacyjna sekwencja DNA jest funkcjonalnie połączona lub zasocjowana z sekwencją DNA, która koduje mrna lub która jest wyrażana jako białko, tak, że sekwencja regulacyjna DNA jest zdolna do regulacji transkrypcji lub ekspresji zasocjowanej sekwencji DNA. Regulacyjna sekwencja DNA hybrydowego genu nie jest normalnie funkcjonalnie połączona do zasocjowanej sekwencji DNA znajdowanej w naturze. Określenie kodująca sekwencja DNA" odnosi się do sekwencji DNA, która ulega translacji w organizmie by wyprodukować białko. Określenie domena" oznacza część syntazy poliketydu potrzebną do danej konkretnej aktywności. Przykłady obejmują domeny: białka nośnika acylu (ACP), β-ketosyntazy (KS), acylotransferazy (AT), β-ketoreduktazy(kr), dehydratazy (OH), enoiloreduktazy (ER) i tioesterazy (TE). Określenie epotilony" oznacza 16-członowe makrocykliczne poliketydy naturalnie produkowane przez bakterię Sorangium cellulosum szczep So ce90, które imitują biologiczne efekty taksolu. W tym zgłoszeniu, określenie "epotilon" dotyczy klasy poliketydów, która obejmuje epotilon A i epotilon B, jak i ich analogi takie jak te opisane w WO 98/25929. Określenie syntaza epotilonu" dotyczy syntazy poliketydu odpowiedzialnej za biosyntezę epotilonu. Określenie gen" oznacza zdefiniowany region, który jest zlokalizowany w obrębie genomu i który oprócz wymienionej sekwencji kodującej DNA, zawiera inne, przede wszystkim regulacyjne sekwencje DNA odpowiedzialne za kontrolę ekspresji, to znaczy transkrypcji i translacji, części kodującej. Określenie heterologiczna sekwencja DNA" oznacza sekwencję DNA nie związaną naturalnie z komórką gospodarza, do której jest wprowadzana obejmując nie występujące naturalnie wielkokrotne kopie naturalnie występującej sekwencji DNA. Określenie homologiczna sekwencja DNA" dotyczy sekwencji DNA naturalnie zasocjowanej z komórką gospodarza, do której jest wprowadzana. Określenie homologiczna rekombinacja" odnosi się do wzajemnej wymiany fragmentów DNA między homologicznymi cząsteczkami DNA. Określenie izolowany": W kontekście niniejszego wynalazku, wyizolowana cząsteczka kwasu nukleinowego lub wyizolowany enzym jest cząsteczką kwasu nukleinowego lub enzymem, która, dzięki ręce ludzkiej istnieje poza swoim naturalnym środowiskiem i nie jest więc produktem naturalnym. Wyizolowana cząsteczka kwasu nukleinowego lub enzym może istnieć w postaci oczyszczonej lub może istnieć w nienaturalnym otoczeniu takim jak na przykład zrekombinowana komórka gospodarza. Określenie moduł" oznacza element genetyczny kodujący wszystkie odrębne aktywności wymagane w pojedynczej rundzie biosyntezy poliketydu tzn. jeden etap kondensacji i wszystkie związane z nią etapy obróbki β-karbonylu. Każdy moduł koduje aktywność ACP, KS, i AT aby uzyskać część kondensowaną biosyntezy i wybrane aktywności pokondensacyjne by przeprowadzić obróbkę β-karbonylu. NRPS" - nierybosomalna syntetaza peptydu, która jest kompleksem aktywności enzymatycznych odpowiedzialnych za włączanie aminokwasów do metabolitów wtórnych obejmując na przykład domeny adenylacji aminokwasu, epimeryzacji, N-metylacji, cyklizacji, białka nośnika acylu i kondensacji. Funkcjonalny NRPS to taki, który katalizuje włączenie aminokwasu do metabolitu wtórnego.

10 PL 200 157 B1 Gen NRPS" - jeden lub więcej genów kodujących NRPS dla produkcji funkcjonalnych metabolitów wtórnych np. epotilonów A i B, gdy są pod kontrolą jednego lub więcej kompatybilnych elementów kontroli. Cząsteczka kwasu nukleinowego" - liniowy odcinek jedno- lub dwuniciowego DNA lub RNA, który może być wyizolowany z dowolnego źródła. W kontekście niniejszego wynalazku, cząsteczka kwasu nukleinowego korzystnie jest odcinkiem DNA. ORF" - otwarta ramka odczytu. PKS" - syntaza poliketydu, która jest kompleksem aktywności enzymatycznych (domen) odpowiedzialnych za biosyntezę poliketydów obejmując na przykład ketoreduktazę, dehydratazę, białko nośnika acylu, enoiloreduktazę, syntazę ketoacylo ACP i acylotransferazę. Funkcjonalna PKS to taka, która katalizuje syntezę poliketydu. Geny PKS" - jeden lub więcej genów kodujących różne polipeptydy wymagane do produkcji funkcjonalnych poliketydów, np. epotilonów A i B, gdy są pod kontrolą jednego lub więcej kompatybilnych elementów kontrolnych. Zasadniczo podobne" - odnośnie kwasów nukleinowych to cząsteczka kwasu nukleinowego, która ma przynajmniej 60 procent identyczności sekwencji z referencyjną cząsteczką kwasu nukleinowego. W korzystnej postaci, zasadniczo podobna sekwencja DNA jest w przynajmniej 95% identyczna podobna sekwencja DNA jest przynajmniej w 80% identyczna do referencyjnej sekwencji DNA; w bardziej korzystnej postaci, zasadniczo podobna sekwencja DNA jest w przynajmniej 90% identyczna do referencyjnej sekwencji DNA; i w najbardziej korzystnej postaci, do referencyjnej sekwencji DNA. Zasadniczo podobna sekwencja DNA korzystnie koduje białko lub peptyd mające zasadniczo tę samą aktywność jak białko lub peptyd kodowany przez referencyjną sekwencję DNA. Zasadniczo podobna sekwencja nukleotydów typowo hybrydyzuje do referencyjnej cząsteczki kwasu nukleinowego, lub jej fragmentów w następujących warunkach: hybrydyzacja w 7% dodecylosiarczanie sodu (SOS), 0,5 M NaPO 4 ph 7,0, 1 mm EDTA w 50 C; płukanie 2 x SSC, 1% SOS, w 50 C. W odniesieniu do białek lub peptydów, zasadniczo podobna sekwencja aminokwasów jest sekwencją aminokwasów, która jest przynajmniej w 90% identyczna do sekwencji aminokwasów referencyjnego białka lub peptydu i ma zasadniczo tę samą aktywność jak białko referencyjne lub peptyd. Transformacja" oznacza proces wprowadzania heterologicznego kwasu nukleinowego do komórki lub organizmu gospodarza. Określenie transformowany / transgeniczny / zrekombinowany" - dotyczy organizmu gospodarza takiego jak bakteria, do którego wprowadzono heterologiczną cząsteczkę kwasu nukleinowego. Cząsteczka kwasu nukleinowego może być stabilnie wprowadzona do genomu gospodarza lub cząsteczka kwasu nukleinowego może być też obecna jako cząsteczka pozachromosomalna. Taka cząsteczka pozachromosomalna może być autoreplikująca. Transformowane tkanki, komórki lub rośliny są rozumiane jako obejmujące nie tylko produkt procesu transformacji ale także jego transgeniczne potomstwo. "Nieransformowany", "nietransgeniczny", lub "niezrekombinowany" gospodarz dotyczy organizmu typu dzikiego, tzn. bakterii, która nie zawiera heterologicznej cząsteczki kwasu nukleinowego. Nukleotydy są wskazywane poprzez ich zasady przez następujące standardowe skróty: adenina (A), cytozyna (C), tymina (T), i guanina (G). Aminokwasy są podobnie wskazywane przez następujące standardowe skróty: alanina (ala; A), arginina (Arg; R), asparagina (Asn; N), kwas asparaginowy (Asp; D), cysteina (Cys; C), glutamina (Gin; Q), kwas glutaminowy (Glu; E), glicyna (Gly; G), histydyna (His; H), izoleucyna (Ile; I), leucyna (Leu; L), lizyna (lys; K), metionina (Met; M), fenyloalanina (Phe; F), pralina (Pro; P), seryna (Ser; S), treonina (Thr; T), tryptofan (Trp; W), tyrozyna (Tyr; y), i walina (Val; V). Co więcej, (Xaa; X) przedstawia dowolny aminokwas. Opis sekwencji w liście sekwencji SEQ ID NO:1 jest sekwencją nukleotydów kontigu 68750 bp zawierającego 22 otwarte ramki odczytu (ORF), które obejmują gen biosyntezy epotilonu. SEQ ID NO:2 jest sekwencją białka syntazy poliketydu typu I (EPOS A) kodowanej przez epoa (nukleotydy 7610-11875 SEQ ID NO:1). SEQ ID NO:3 jest sekwencją białka nierybosomalnej syntetazy peptydowej (EPOS P) kodowanej przez epop (nukleotydy 11872-16104 SEQ ID NO:1). SEQ ID NO:4 jest sekwencją białka syntazy poliketydu typu I (EPOS B) kodowanej przez epob (nukleotydy 16251-21749 SEQ ID NO:1). SEQ ID NO:5 jest sekwencją białka syntazy poliketydu typu I (EPOS C) kodowanej przez epoc (nukleotydy 21746-43519 SEQ ID NO:1).

PL 200 157 B1 11 SEQ ID NO:6 jest sekwencją białka syntazy poliketydu typu I (EPOS D) kodowanej przez epod (nukleotydy 43524-54920 SEQ ID NO:1). SEQ ID NO:7 jest sekwencją białka syntazy poliketydu typu I (EPOS E) kodowanej przez epoe (nukleotydy 54935-62254 SEQ ID NO:1). SEQ ID NO:8 jest sekwencją białka homologu oksygenazy cytochromu P450 (EPOS F) kodowaną przez ep (nukleotydy 62369-63628 SEQ ID NO:1). SEQ ED NO:9 jest częściową sekwencją białka (częściową Orf 1) kodowaną przez orf1 (nukleotydy 1-1826 SEQ ID NO:1). SEQ ID NO:10 jest sekwencją białka (Orf 2) kodowaną przez orf2 (nukleotydy 3171-1900 na odwrotnym komplemencie nici SEQ ID NO:1). SEQ ID NO:11 jest sekwencją białka (Orf 3) kodowaną przez orf3 (nukleotydy 3415-5556 SEQ ID NO:1). SEQ ID NO:12 jest sekwencją białka (Orf 4) kodowaną przez orf4 (nukleotydy 5992-5612 na odwrotnym komplemencie nici SEQ ID NO: 1). SEQ ID NO:13 jest sekwencją białka (Orf 5) kodowaną przez orf5 (nukleotydy 6226-6675 SEQ ID NO:1). SEQ ID NO:14 jest sekwencją białka (Orf 6) kodowaną przez orf6 (nukleotydy 63779-64333 SEQ ID NO:1). SEQ ID NO:15 jest sekwencją białka (Orf 7) kodowaną przez orf7 (nukleotydy 64290-63853 na odwrotnym komplemencie nici SEQ ID NO:1). SEQ ID NO:16 jest sekwencją białka (Orf 8) kodowaną przez orf8 (nukleotydy 64363-64920 SEQ ID NO:1). SEQ ID NO:17 jest sekwencją białka (Orf 9) kodowaną przez orf9 (nukleotydy 64727-64287 na odwrotnym komplemencie nici SEQ ID NO:1). SEQ ID NO:18 jest sekwencją białka (Orf 10) kodowaną przez orf10 (nukleotydy 65063-65767 SEQ ID NO:1). SEQ ID NO:19 jest sekwencją białka (Orf 11) kodowaną przez orf11 (nukleotydy 65874-65008 na odwrotnym komplemencie nici SEQ ID NO:1). SEQ ID NO:20 jest sekwencją białka (Orf 12) kodowaną przez orf12 (nukleotydy 66338-65871 na odwrotnym komplemencie nici SEQ ID NO:1). SEQ ID NO:21 jest sekwencją białka (Orf 13) kodowaną przez orf13 (nukleotydy 66667-67137 SEQ ID NO:1). SEQ ID NO:22 jest sekwencją białka (Orf 14) kodowaną przez orf14 (nukleotydy 67334-68251 SEQ ID NO: 1). SEQ ID NO:23 jest częściową sekwencję białka (częściowy Orf 15) kodowaną przez orf15 (nukleotydy 68346-68750 SEQ ID NO:1). SEQ ID NO:24 jest sekwencją uniwersalnego odwrotnego primera do PCR. SEQ ID NO:25 jest sekwencją uniwersalnego primera 5' do PCR. SEQ ID NO:26 jest sekwencją NH24 końca "B" do PCR. SEQ ID NO:27 jest sekwencją NH2 końca "A" do PCR. SEQ ID NO:28 jest sekwencją NH2 końca "B" do PCR. SEQ ID NO:29 jest sekwencją pepo15-nh6 końca "B" do PCR. SEQ ID NO:30 jest sekwencją pepo15-h2.7 końca "A" do PCR. Informacja o depozytach Następujący materiał zdeponowano w Agricultural Research Service, Patent Culture Collection (NRRL), 1815 North University Street, Peoria, Illinois 61604, w ramach traktatu Budapeszteńskiego o Międzynarodowym uznaniu Depozytów Mikroorganizmów dla Celów Procedury Patentowej. Wszystkie ograniczenia odnośnie dostępności materiału zostaną nieodwołalnie usunięte po przyznaniu patentu. Zdeponowany materiał Numer dostępu Data depozytu pepo15 NRRLB-30033 11 czerwca 1998 pepo32 NRRLB-30119 16 kwietnia 1999 Geny biorące udział w biosyntezie epotilonów mogą być wyizolowane przy zastosowaniu sposobu według niniejszego wynalazku. Korzystna procedura izolacji genu biosyntezy epotilonu wymaga izolacji genomowego DNA z organizmu zidentyfikowanego jako produkujący epotilony A i B i przeniesienie wyizolowanego DNA na odpowiednim plazmidzie lub wektorze do organizmu gospodarza, który normalnie nie produkuje poliketydu, a następnie identyfikacja stransformowanych kolonii gospodarza,

12 PL 200 157 B1 którym nadano zdolność do produkcji epotilonu. Stosując technikę taką jak mutageneza transpozonem λ::tn5 (de Bruijn i Lupski, Gene 27: 131149 (1984)), można bardziej dokładnie zidentyfikować dokładny region nadający transformujący DNA epotilonu. Alternatywnie lub dodatkowo transformujący DNA nadający epotilon może być pocięty na mniejsze fragmenty i najmniejszy, który utrzymuje zdolność do nadawania epotilonu może być dalej scharakteryzowany. Podczas gdy organizm nie posiadający zdolności do produkcji epotilonu może być innym gatunkiem od organizmu, z którego pochodzi poliketyd, wariant tej techniki obejmuje transformację DNA gospodarza do tego samego gospodarza, który ma zdolność do syntezy epotilonu zniszczoną przez mutagenezę. W tym sposobie mutuje się organizm produkujący epotilon i izoluje się mutanty nie produkujące epotilonu. Te są następnie komplementowane przez genomowy DNA, wyizolowany z rodzicielskiego szczepu produkującego epotilon. Dalszy przykład techniki, która może być stosowana do wyizolowania genu wymaganego do biosyntezy epotilonu jest stosowanie mutagenezy transpozonowej do wytwarzania mutantów produkującego epotilon organizmu, który po mutagenezie nie produkuje poliketydu. Tak więc region genomu gospodarza odpowiedzialny za produkcję epotilonu jest znakowany przez transpozon i może być odzyskany i stosowany jako sonda do izolacji natywnego genu ze szczepu rodzicielskiego. Geny PKS, które są wymagane do syntezy poliketydów i które są podobne do znanych genów PKS mogą być wyizolowane na podstawie ich homologii sekwencji do genów biosyntetycznych, których sekwencja jest znana, takich jak biosyntezy rifamycyny lub sorafenu. Techniki odpowiednie do izolacji na podstawie homologii obejmują standardowy skrining bibliotek poprzez hybrydyzację DNA. Korzystne do stosowania jako cząsteczka sondy jest fragment DNA, który jest do uzyskania z genu lub innej sekwencji DNA, która bierze udział w syntezie znanego poliketydu. Korzystna cząsteczka sondy zawiera fragment DNA 1,2 kb Smal kodujący domenę ketosyntazy czwartego modułu PKS sorafenu (amerykański dokument patentowy nr 5,716,849) i bardziej preferowana cząsteczka sondy obejmuje domeny syntazy β-ketoacylu z pierwszego i drugiego modułu PKS rifamycyny (Schupp i wsp., FEMS Microbiology Letters 159: 201-207 (1998)). Mogą one być zastosowane do przeszukania biblioteki genowej aby wyizolować gen PKS odpowiedzialny za biosyntezę epotilonu. Mimo dobrze znanych ogólnych trudności z izolacją genu PKS i mimo spodziewanych trudności przy izolacji w szczególności genu biosyntezy epotilonu przez stosowanie sposobów opisanych w niniejszej specyfikacji jest zadziwiające, że geny biosyntezy dla epotilonów A i B mogą być sklonowane z mikroorganizmu, który produkuje ten poliketyd. Stosując sposoby manipulacji genów i produkcji zrekombinowanej opisane w tej specyfikacji, sklonowany gen PKS może być zmodyfikowany i wyrażony w transgenicznym organizmie gospodarza. Wyizolowany gen biosyntezy epotilonu może być wyrażony w heterologicznym gospodarzu aby pozwolić na produkcję poliketydu z większą skutecznością niż by było możliwe z naturalnych gospodarzy. Techniki dla tych genetycznych manipulacji są specyficzne dla różnych odpowiednich gospodarzy i są znane w dziedzinie. Na przykład heterologiczny gen może być wyrażony w Streptomyces i innych promieniowcach stosując techniki takie jak opisane w McDaniel i wsp., Science 262: 1546- -1550 (1993) i Kao i wsp., Science 265: 509-512 (1994), z których oba są tu włączone w postaci odniesienia. Zobacz też, Rowe i wsp., Gene 216: 215-223 (1998); Holmes i wsp., EMBO Journal 12(8): 31833191 (1993) i Bibb i wsp., Gene 38: 215-226 (1985), z których wszystkie są tu włączone jako odnośniki. Alternatywnie, gen odpowiedzialny za biosyntezę poliketydu, np. gen biosyntezy epotilonu może być też wyrażony w innych organizmach gospodarza takich jak Pseudomonas i E. coli. Techniki dla tych genetycznych manipulacji są specyficzne dla różnych dostępnych gospodarzy i są znane w dziedzinie. Na przykład geny PKS wyrażano z powodzeniem w E.coli stosując wektor pt7-7, który stosuje promotor T7. Zobacz Tabor i wsp., Proc. Natl. Acad. Sci. USA 82: 1074-1078 (1985), włączone w postaci odniesienia. Dodatkowo, wektory ekspresyjne pkk223-3 i pkk223-2 mogą być stosowane do ekspresji heterologicznego genu w E. coli, w postaci fuzji transkrypcyjnej lub translacyjnej, za promotorem tac lub trc. Dla ekspresji operonów kodujących wielokrotne ORF, najprostszą procedurą jest wstawienie operonu do wektora takiego jak pkk223-3 w fuzji transkrypcyjnej fuzji pozwalając na stosowanie odpowiedniego miejsca wiązania heterologicznego genu. Techniki do nadekspresji w gatunkach Gram-dodatnich takich jak Bacillus są dobrze znane w dziedzinie i mogą być stosowane w kontekście tego wynalazku (Quax i wsp., w: Industrial Microorganisms: Basic and Applied Molecular Genetics, Red. Baltz i wsp., American Society for Microbiology, Washington (1993)). Inne systemy ekspresyjne, które mogą być stosowane z genem biosyntezy epotilonu według wynalazku obejmują układy ekspresyjne drożdży i bakulowirusów. Zobacz na przykład "The Expression of Recombinant Proteins in Yeasts," Sudbery, P. E., Curr. Opin. Biotechnol. 7(5): 517-524 (1996);