(86) Data i numer zgłoszenia międzynarodowego: , PCT/US00/25078 (87) Data i numer publikacji zgłoszenia międzynarodowego:

Podobne dokumenty
WYNALAZKI BIOTECHNOLOGICZNE W POLSCE. Ewa Waszkowska ekspert UPRP

Nowoczesne systemy ekspresji genów

Przeglądanie bibliotek

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Klonowanie molekularne Kurs doskonalący. Zakład Geriatrii i Gerontologii CMKP

Inżynieria genetyczna- 6 ECTS. Inżynieria genetyczna. Podstawowe pojęcia Część II Klonowanie ekspresyjne Od genu do białka

TATA box. Enhancery. CGCG ekson intron ekson intron ekson CZĘŚĆ KODUJĄCA GENU TERMINATOR. Elementy regulatorowe

Dr. habil. Anna Salek International Bio-Consulting 1 Germany

Wybrane techniki badania białek -proteomika funkcjonalna

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

KLONOWANIE DNA REKOMBINACJA DNA WEKTORY

Wybrane techniki badania białek -proteomika funkcjonalna

TRANSKRYPCJA - I etap ekspresji genów

Proteomika: umożliwia badanie zestawu wszystkich lub prawie wszystkich białek komórkowych

Metody odczytu kolejności nukleotydów - sekwencjonowania DNA

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Analizy wielkoskalowe w badaniach chromatyny

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Rok akademicki: 2014/2015 Kod: EIB BN-s Punkty ECTS: 3. Kierunek: Inżynieria Biomedyczna Specjalność: Bionanotechnologie

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Mapowanie fizyczne genomów -konstrukcja map wyskalowanych w jednostkach fizycznych -najdokładniejszą mapą fizyczną genomu, o największej

Ćwiczenia 1 Wirtualne Klonowanie Prowadzący: mgr inż. Joanna Tymeck-Mulik i mgr Lidia Gaffke. Część teoretyczna:

Bloki licencjackie i studia magisterskie na Kierunkach: Biotechnologia, specjalność Biotechnologia roślinna oraz Genetyka

Wykład 14 Biosynteza białek

TECHNIKI ANALIZY RNA TECHNIKI ANALIZY RNA TECHNIKI ANALIZY RNA

WYKŁAD: Klasyczny przepływ informacji ( Dogmat) Klasyczny przepływ informacji. Ekspresja genów realizacja informacji zawartej w genach

Transformacja pośrednia składa się z trzech etapów:

Geny i działania na nich

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

Biologia medyczna, materiały dla studentów

Biologia Molekularna z Biotechnologią ===============================================================================================

DR ŻANETA PACUD Zdolność patentowa roślin

Hybrydyzacja kwasów nukleinowych

Hybrydyzacja kwasów nukleinowych

Dane mikromacierzowe. Mateusz Markowicz Marta Stańska

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

(86) Data i numer zgłoszenia międzynarodowego: ,PCT/GB00/00248 (87) Data i numer publikacji zgłoszenia międzynarodowego:

Zawartość. Wstęp 1. Historia wirusologii. 2. Klasyfikacja wirusów

Metody badania ekspresji genów

Badanie funkcji genu

Inżynieria Genetyczna ćw. 3

Powodzenie reakcji PCR wymaga właściwego doboru szeregu parametrów:

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Dopasowanie sekwencji (sequence alignment)

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Tematyka zajęć z biologii

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Techniki molekularne w mikrobiologii SYLABUS A. Informacje ogólne

Metody analizy genomu

2. Enzymy pozwalające na manipulację DNA a. Polimerazy DNA b. Nukleazy c. Ligazy

GENOMIKA FUNKCJONALNA. Jak działają geny i genomy? Poziom I: Analizy transkryptomu

Techniki biologii molekularnej Kod przedmiotu

mikrosatelitarne, minisatelitarne i polimorfizm liczby kopii

SYLABUS. Wydział Biologiczno-Rolniczy. Katedra Biochemii i Biologii Komórki

Historia informacji genetycznej. Jak ewolucja tworzy nową informację (z ma ą dygresją).

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

BUDOWA I FUNKCJA GENOMU LUDZKIEGO

Oznaczenie polimorfizmu genetycznego cytochromu CYP2D6: wykrywanie liczby kopii genu

Badanie funkcji genu

Plan wykładu: Budowa chromatyny - nukleosomy. Wpływ nukleosomów na replikację i transkrypcję

Rośliny modyfikowane genetycznie (GMO)

SYLABUS. Wydział Biologiczno-Rolniczy. Katedra Biochemii i Biologii Komórki

Biologia Molekularna Podstawy

dostateczny oraz: wyjaśnia, z czego wynika komplementarność zasad przedstawia graficznie regułę

Biotechnologia i inżynieria genetyczna

(62) Numer zgłoszenia, z którego nastąpiło wydzielenie: (86) Data i numer zgłoszenia międzynarodowego: , PCT/EP03/009145

Porównywanie i dopasowywanie sekwencji

1. Biotechnologia i inżynieria genetyczna zagadnienia wstępne 13

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

TRANSLACJA II etap ekspresji genów

GENOMIKA FUNKCJONALNA. Jak działają geny i genomy? Poziom I: Analizy transkryptomu

RT31-020, RT , MgCl 2. , random heksamerów X 6

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Analiza sekwencji promotorów

Ćwiczenia 1 Wirtualne Klonowanie. Prowadzący: mgr Anna Pawlik i mgr Maciej Dylewski. Część teoretyczna:

Wymagania edukacyjne Biologia na czasie zakres podstawowy

S YL AB US MODUŁ U ( PRZEDMIOTU) I nforma c j e ogólne

PL B1. Sposób i układ do modyfikacji widma sygnału ultraszerokopasmowego radia impulsowego. POLITECHNIKA GDAŃSKA, Gdańsk, PL

Inwestycja w przyszłość czyli znaczenie ochrony własności przemysłowej dla współczesnej biotechnologii

WYMAGANIA EDUKACYJNE Z BIOLOGII, ZAKRES PODSTAWOWY 2018/19

6. Z pięciowęglowego cukru prostego, zasady azotowej i reszty kwasu fosforowego, jest zbudowany A. nukleotyd. B. aminokwas. C. enzym. D. wielocukier.

WYMAGANIA EDUKACYJNE BIOLOGIA NA CZASIE, ZAKRES PODSTAWOWY

WYMAGANIA EDUKACYJNE BIOLOGIA zakres podstawowy biologia na czasie

Wymagania edukacyjne Biologia na czasie zakres podstawowy

Księgarnia PWN: Biotechnologia roślin, redakcja naukowa: Stefan Malepszy SPIS TREŚCI

Wymagania na poszczególne stopnie szkolne dla przedmiotu biologia. Klasa I Liceum Ogólnokształcącego poziom podstawowy

Wymagania edukacyjne Biologia na czasie zakres podstawowy przedmiot biologia nauczana dwujęzycznie poziom podstawowy klasa Ib i Ic

Wymagania edukacyjne Biologia na czasie, zakres podstawowy

Wymagania edukacyjne z biologii- zakres podstawowy: kl 1 ZSZ, 1LO

Wymagania edukacyjne Biologia na czasie zakres podstawowy

Metody: PCR, MLPA, Sekwencjonowanie, PCR-RLFP, PCR-Multiplex, PCR-ASO

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

WARUNKI ZALICZENIA PRZEDMIOTU- 5 ECTS

definiuje pojęcia: inżynieria genetyczna, replikacja DNA wyjaśnia regułę komplementarności

Wymagania edukacyjne z przedmiotu Biologia. Podręcznik Biologia na czasie wyd. Nowa Era, zakres podstawowy Rok szkolny 2013/2014

Inżynieria genetyczna

WYMAGANIA EDUKACYJNE Z BIOLOGII (Klasa 1B, 1C, 1D, 1E, 1F ;rok szkolny 2018/2019) - ZAKRES PODSTAWOWY - NOWA ERA. dostateczny (P) podstawowy

Biotechnologia jest dyscypliną nauk technicznych, która wykorzystuje procesy biologiczne na skalę przemysłową. Inaczej są to wszelkie działania na

Transkrypt:

RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 204789 (21) Numer zgłoszenia: 364978 (13) B1 Urząd Patentowy Rzeczypospolitej Polskiej (22) Data zgłoszenia: 13.09.2000 (86) Data i numer zgłoszenia międzynarodowego: 13.09.2000, PCT/US00/25078 (87) Data i numer publikacji zgłoszenia międzynarodowego: 22.03.2001, WO01/19976 PCT Gazette nr 12/01 (51) Int.Cl. C12N 15/82 (2006.01) A01H 5/00 (2006.01) (54) Promotor, rekombinowana konstrukcja DNA, transgeniczna komórka roślinna, transgeniczna roślina i sposób wytwarzania transgenicznej rośliny (73) Uprawniony z patentu: MONSANTO TECHNOLOGY LLC,St.Louis,US (30) Pierwszeństwo: 16.09.1999,US,60/154,182 (43) Zgłoszenie ogłoszono: 27.12.2004 BUP 26/04 (72) Twórca(y) wynalazku: Heather M. Anderson,St. Louis,US Catherine A. Chay,St. Louis,US Guilan Chen,Wildwood,US Timothy W. Conner,Wildwood,US (45) O udzieleniu patentu ogłoszono: 26.02.2010 WUP 02/10 (74) Pełnomocnik: Bartnik Urszula, Rzecznik Patentowy, POLSERVICE, Kancelaria Rzeczników Patentowych Sp. z o.o. PL 204789 B1

2 PL 204 789 B1 Opis wynalazku Dziedzina wynalazku Przedmiotem wynalazku jest promotor, rekombinowana konstrukcja DNA, transgeniczna komórka roślinna, transgeniczna roślina i sposób wytwarzania transgenicznej rośliny. Wynalazek przeznaczony jest do kontrolowania ekspresji genu w roślinach, zwłaszcza nowych promotorów roślinnych. Tło wynalazku Jednym z celów inżynierii genetycznej roślin jest produkcja roślin o właściwościach lub cechach ważnych pod względem agronomicznym. Ostatnie osiągnięcia w inżynierii genetycznej dostarczyły niezbędnych narzędzi do transformowania roślin, umożliwiając wprowadzanie i ekspresję w roślinach obcych genów (Kahl i wsp., World Journal of Microbiology and Biotechnology 11: 449-460, 1995). Do szczególnie pożądanych cech lub właściwości, które są przedmiotem zainteresowania inżynierii genetycznej roślin należą między innymi cechy odporności na owady i inne szkodniki oraz na czynniki chorobotwórcze, odporności na herbicydy, zwiększona stabilność, wydajność lub dłuższy czas magazynowania, tolerowanie czynników środowiskowych i poprawa wartości odżywczych. Postęp technologiczny w transformowaniu i regeneracji roślin umożliwił naukowcom pobieranie odcinków DNA, takich jak gen lub geny ze źródła heterologicznego bądź ze źródła natywnego jednak zmodyfikowanego tak, aby dawało inne bądź ulepszone cechy jakościowe i wprowadzanie tego egzogennego DNA do genomu roślinnego. Taki gen lub geny mogą następnie podlegać ekspresji w komórce roślinnej, ujawniając dodaną charakterystyczną właściwość lub cechę. W jednym podejściu, ekspresja nowego genu, czyli takiego, którego ekspresja nie zachodzi w danej roślinie lub tkance roślinnej, może wywierać pożądany wpływ na fenotyp. W innym podejściu, transkrypcja genu lub części genu w orientacji antysensownej może dawać pożądany efekt przez zapobieganie lub hamowanie ekspresji genu endogennego. Izolowane promotory roślinne są użyteczne do modyfikowania roślin techniką inżynierii genetycznej w celu nadania im pożądanych cech fenotypowych. W celu wyprodukowania takiej transgenicznej rośliny, do komórki roślinnej wprowadza się wektor zawierający heterologiczną sekwencję genu, nadającą żądany fenotyp po ekspresji w tej roślinie. Taki wektor zawiera również promotor roślinny, związany operacyjnie z heterologiczną sekwencją genu, częste, promotor nie związany z tym heterologicznym genem w stanie naturalnym. Taki wektor wprowadza się do komórki roślinnej, wytwarzając transformowaną komórkę roślinną i z tej transformowanej komórki roślinnej regeneruje się transgeniczną roślinę. Promotor rządzi ekspresją wprowadzonej sekwencji DNA, z którą został operacyjnie związany i w ten sposób wpływa na pożądaną właściwość wniesioną przez tę sekwencję DNA. Promotor jest elementem regulacyjnym 5', odgrywającym integralną rolę w ogólnej ekspresji genu lub genów, a więc, byłoby korzystne posiadanie wielu różnych promotorów, tak, aby dopasować ekspresję genu w ten sposób, by transkrypcja tego genu (genów) przebiegała wydajnie w odpowiednim czasie wzrostu i rozwoju rośliny, w optymalnej lokalizacji w roślinie i w ilości pozwalającej uzyskać pożądany efekt. W jednym przypadku, konstytutywna ekspresja produktu genu może być np. korzystna w jednej części rośliny ale mniej korzystna w innej części tej rośliny. W innych przypadkach, może się okazać korzystne wytwarzanie produktu genu w pewnym etapie rozwoju rośliny albo w odpowiedzi na pewne bodźce środowiskowe lub chemiczne. Handlowy rozwój ulepszonej genetycznie plazmy zarodkowej osiągnął już etap wprowadzania wielu różnych cech do roślin uprawnych, zwany również podejściem "stożenia" genów. W podejściu tym, do rośliny można wprowadzić wiele różnych genów nadających różne pożądane właściwości. Przy wprowadzaniu do rośliny wielu różnych genów, ważne jest, aby każdy gen był modulowany lub kontrolowany pod kątem optymalnej ekspresji i aby elementy regulacyjne były zróżnicowane, tak, aby zmniejszyć możliwość "wyciszenia" genu, które może być spowodowane rekombinacją sekwencji homologicznych. W świetle tych i innych rozważań, oczywiste jest, że optymalna kontrola ekspresji genu i różnorodność elementów regulacyjnych są ważnymi czynnikami w biotechnologii roślin. Dla nowo wprowadzonego przez insercję DNA muszą być obecne odpowiednie sekwencje regulatorowe i muszą się one znajdować w odpowiedniej lokalizacji względem żądanej sekwencji DNA, tak, aby mogła ona podlegać transkrypcji i następnie, jeśli to pożądane, translacji na białko w komórce roślinnej. Do takich sekwencji regulatorowych należą, między innymi: promotor, nie podlegający translacji lider 5' i sekwencja poliadenylacji 3'. Poprzez dobór odpowiednich sekwencji promotora, kontrolujących transkrypcję tych genów, możliwy jest również dobór tkanek, w których ma zachodzić tran-

PL 204 789 B1 3 skrypcja obcego DNA i dobór czasu podczas wzrostu rośliny, w którym ma przebiegać transkrypcja tego obcego DNA. W inżynierii genetycznej roślin można stosować wiele różnych typów lub klas promotorów. Promotory te można sklasyfikować na podstawie zakresu aktywności lub specyficzności względem tkanek. Przykładowo, promotory zaliczane do promotorów konstytutywnych mają zdolność wydajnej transkrypcji związanych z nimi operacyjnie sekwencji DNA i ekspresji tych sekwencji DNA w wielu tkankach. W pewnych tkankach roślinnych lub swoiście w szczególnych tkankach roślinnych znajdują się wzmacniane tkankowo bądź swoiste tkankowo promotory w kierunku 5' od związanych z nimi operacyjnie sekwencjami DNA, których transkrypcja w normalnych warunkach przebiega na wysokich poziomach. Do innych klas promotorów będą należały między innymi promotory indukowane, aktywność których jest uwalniana przez bodźce zewnętrzne, takie jak środki chemiczne, bodźce rozwojowe lub środowiskowe. Tak więc, można uzyskać różne typy żądanych promotorów przez wyizolowanie regionów 5'-regulatorowych sekwencji DNA położonych w kierunku 5', które to regiony są transkrybowane i podlegają ekspresji w sposób konstytutywny, wzmacniany tkankowo lub indukowany. Postęp technologiczny w wysokosprawnym sekwencjonowaniu i w bioinformatyce dostarczył dodatkowych narządzi molekularnych do wykrywania promotorów. Jako materiał źródłowy do izolowania mrna i konstruowania bibliotek cdna można użyć, docelowe komórki, tkanki lub organy roślinne w określonym stadium rozwoju lub pozostające pod wpływem konkretnych warunków chemicznych, środowiskowych lub fizjologicznych. Biblioteki cdna sekwencjonuje się szybko i sekwencje podlegające ekspresji kataloguje się elektronicznie. Przy użyciu oprogramowania komputerowego do analizy sekwencji, można w krótkim czasie zanalizować tysiące sekwencji i można porównywać sekwencje z wybranych bibliotek cdna. Połączenie metod laboratoryjnych i komputerowych metod odejmujących pozwala badaczom na skanowanie i porównywanie bibliotek cdna i identyfikację sekwencji o żądanym profilu ekspresji. Przykładowo, sekwencje, których ekspresja przebiega preferencyjnie w jednej tkance można zidentyfikować przez porównanie biblioteki cdna z jednej tkanki z biblioteką cdna z innych tkanek i "odejmowanie" technikami elektronicznymi sekwencji wspólnych, znajdując te sekwencje, których ekspresja przebiega tylko w tkance docelowej, będącej przedmiotem zainteresowania. Taka wzmacniana tkankowo sekwencja może być następnie użyta jako sonda lub primer do klonowania odpowiedniego cdna o pełnej długości. Następnie można wykorzystać bibliotekę genomową danej rośliny do wyizolowania odpowiedniego genu i związanych z nim elementów regulacyjnych, w tym sekwencji promotorowych. Wiele różnych sekwencji promotorowych, nadających żądany profil ekspresji, takich jak promotory zdolne do regulowania ekspresji związanych z nimi operacyjnie genów w wielu tkankach można wyizolować przez selektywne porównywanie bibliotek cdna docelowych tkanek z bibliotekami cdna nie-docelowymi lub stanowiącymi tło, znajdując w docelowych bibliotekach regiony regulacyjne 5' związane z sekwencjami podlegającymi ekspresji. Wyizolowane sekwencje promotorowe można stosować do selektywnego modulowania ekspresji dowolnego, związanego operacyjnie genu, zwiększając rozmaitość dodatkowych elementów regulatorowych do użycia w roślinnych wektorach ekspresyjnych w technikach polegających na "stożeniu" genów. Przedmiotem wynalazku jest pomctor zawierający sekwencję SEQ ID nr. 69. Następnym przedmiotem wynalazku jest promotor posiadający sekwencję SEQ ID nr: 69. Korzystnie, promotor zawiera ponadto drugą cząsteczkę polinukleotydu połączoną ze wspomnianym promotorem, przy czym ten drugi polinukleotyd zawiera cząsteczkę DNA kodującą EPSPS odporny na glifosat. Bardziej korzystnie, że wspomniany odporny na glifosat EPSPS jest AGRTU.aroA:CP4. Przedmiotem wynalazku jest również rekombinowana konstrukcja DNA, charakteryzująca się tym, że zawiera sekwencję SEQ ID nr. 69 związaną operacyjnie z sekwencją kodującą i nie ulegającym translacji regionem 3'. Przedmiotem wynalazku jest także transgeniczna komórka roślinna zawierająca izolowaną konstrukcję DNA, która zawiera sekwencję SEQ ID nr. 69 związaną operacyjnie z sekwencją kodującą i nie ulegającym translacji regionem 3'. Następnym przedmiotem wynalazku jest transgeniczna roślina zawierająca komórkę rośliny według wynalazku jak zdefiniowano powyżej.

4 PL 204 789 B1 W korzystnym wykonaniu wynalazku transgeniczna roślina jest rośliną jednoliścienną, a bardziej korzystnie zawarta w niej wspomniana konstrukcja DNA nadaje tej roślinie cechę tolerancji herbicydu. Przedmiotem wynalazku jest również sposób wytwarzania transgenicznej rośliny polegający na tym, że: (i) wprowadza się do komórki roślinnej konstrukcję DNA zawierającą (a) promotor zawierający polinukleotyd o sekwencji SEQ ID nr. 69, przy czym promotor ten jest operacyjnie związany z (b) sekwencją kodującą i (c) nie ulegającym translacji regionem 3', (ii) dokonuje się selekcji tej komórki roślinnej i (iii) regeneruje się z tej komórki roślinnej całą roślinę. Krótkie objaśnienia do rysunków Fig. 1 przedstawia mapę plazmidu pmon19469 Fig. 2 przedstawia mapę plazmidu pmon43623 Fig. 3 przedstawia mapę plazmidu pmon42410 Fig. 4 przedstawia mapę plazmidu pmon42411 Fig. 5 przedstawia mapę plazmidu pmon25455 Fig. 6 przedstawia mapę plazmidu pmon46124 Fig. 7 przedstawia mapę plazmidu pmon43644 Fig. 8 przedstawia mapę plazmidu pmon45361 Fig. 9 przedstawia mapę plazmidu pmon43716 Fig. 10 przedstawia mapę plazmidu pmon43738 Fig. 11 przedstawia mapę plazmidu pmon45362 Fig. 12 przedstawia mapę plazmidu pmon43722 Fig. 13 przedstawia mapę plazmidu pmon43739 Fig. 14 przedstawia mapę plazmidu pmon45360. Definicje i sposoby Poniższe definicje i sposoby podano dla lepszego zdefiniowania wynalazku i dla dostarczenia przeciętnemu specjaliście z tej dziedziny wiedzy wskazówek odnośnie praktycznego wykonania wynalazku. O ile nie podano inaczej, terminy należy rozumieć zgodnie z ich powszechnym stosowaniem przez specjalistów z tej dziedziny. Użyto nomenklaturę dla zasad DNA podaną w 37 Kodeksie CFR 1.822. Dla reszt aminokwasowych przyjęto standardową nomenklaturę jedno- i trzyliterową. "Kwas nukleinowy (sekwencja kwasu nukleinowego)" albo "polinukleotyd (sekwencja polinukleotydowa)" odnosi się do jedno- lub dwuniciowego DNA lub RNA pochodzenia genomowego lub syntetycznego, czyli do polimeru odpowiednio zasad dezoksyrybonukleotydowych lub rybonukleotydowych, czytanych od końca 5' (w górę) do końca 3' (w dół). Kwas nukleinowy może reprezentować nić sensowną lub komplementarną (antysensowną). "Natywna" odnosi się do sekwencji kwasu nukleinowego występującej w stanie naturalnym! ("typu dzikiego"). Termin: sekwencja "heterologiczna" oznacza sekwencję pochodzącą z obcego źródła lub gatunku albo, jeśli sekwencja pochodzi z tego samego źródła, wówczas jest zmodyfikowana w stosunku do formy oryginalnej. "Wyizolowana" sekwencja kwasu nukleinowego jest zasadniczo oddzielona lub oczyszczona od innych sekwencji kwasu nukleinowego, z którymi ten kwas nukleinowy jest normalnie związany w komórce organizmu, w którymi ten kwas nukleinowy występuje w stanie naturalnym, a więc od innego DNA chromosomalnego lub poza chromosomalnego. Termin ten obejmuje kwasy nukleinowe, które są oczyszczone biochemicznie tak, aby usunąć z nich zasadniczo zanieczyszczające kwasy nukleinowe i inne składniki komórkowe. Termin ten również obejmuje rekombinacyjne kwasy nukleinowe i kwasy nukleinowe wytworzone na drodze syntezy chemicznej. Termin "zasadniczo oczyszczony", w znaczeniu stosowanym w opisie odnosi się do cząsteczki oddzielonej w zasadzie od wszystkich innych cząsteczek normalnie towarzyszących tej cząsteczce w stanie naturalnym. Bardziej korzystnie, zasadniczo oczyszczona cząsteczka jest składnikiem dominującym w danym preparacie. Zasadniczo oczyszczoną cząsteczką może być cząsteczka wolna od innych cząsteczek występujących w mieszaninie naturalnej w ponad 60%, korzystnie w 75%, bardziej korzystnie w 90% (za wyjątkiem rozpuszczalnika). Termin "zasadniczo oczyszczony" nie obejmuje cząsteczek występujących w stanie naturalnym. Pierwsza sekwencja kwasu nukleinowego wykazuje "zasadniczą identyczność" z referencyjną sekwencją kwasu nukleinowego jeśli po optymalnym przyłożeniu (przy założeniu, że odpowiednie insercje lub delecje nukleotydów będą wynosiły mniej niż 20% sekwencji referencyjnej

PL 204 789 B1 5 w oknie porównawczym) do innego kwasu nukleinowego (lub jego nici komplementarnej) występuje identyczność co najmniej 75% sekwencji nukleotydowej, korzystnie co najmniej około 80%-owa identyczność a jeszcze korzystniej, co najmniej około 85%-owa identyczność a najkorzystniej, co najmniej około 90% identyczność w obrębie okna porównawczego obejmującego co najmniej 20 pozycji nukleotydowych, korzystnie, co najmniej 50 pozycji nukleotydowych, jeszcze korzystniej, co najmniej 100 pozycji nukleotydowych a najkorzystniej w całej długości pierwszego kwasu nukleinowego. Optymalne przykładanie sekwencji do celów nakładania okna porównawczego można przeprowadzić według algorytmu homologii miejscowej Smith'a i Waterman'a (Adv. Appl. Math. 2: 482, 1981), metodą algorytmu homologii nakładania Needleman'a i Wunsch'a (J. Mol. Biol. 48: 443, 1970), metodą poszukiwania podobieństwa Pearson'a i Lipman'a (Proc. Natl. Acad. Sci. USA 85: 2444, 1988), korzystnie z użyciem komputerowych implementacji tych algorytmów (GAP, BESTFIT, FASTA i TFASTA w oprogramowaniu Wisconsin Genetics Software Package Release 7.0, Genetics Computer Group, 575 Science Dr., Madison, WI). Referencyjny kwas nukleinowy może być cząsteczką o pełnej długości albo częścią dłuższej cząsteczki. Alternatywnie, dwa kwasy nukleinowe mają rzeczywiście zasadniczą identyczność jeśli jeden hybrydyzuje z drugim w warunkach wysokich wymagań, zdefiniowanych poniżej. Pierwsza sekwencja kwasu nukleinowego jest "operacyjnie związana" z drugą sekwencją kwasu nukleinowego, jeśli sekwencje te są tak uszeregowane, że pierwsza sekwencja kwasu nukleinowego wpływa na funkcję drugiej sekwencji kwasu nukleinowego. Korzystnie, te dwie sekwencje są częścią jednej, ciągłej cząsteczki kwasu nukleinowego a jeszcze korzystniej, sąsiadują ze sobą. Przykładowo, promotor jest operacyjnie związany z genem jeśli promotor ten reguluje lub wpływa na transkrypcję tego genu w komórce. "Rekombinacyjny" kwas nukleinowy wytwarza się przez sztuczne połączenie dwóch oddzielnie wyodrębnionych segmentów sekwencji, np. przez syntezę chemiczną albo przez manipulację wyizolowanymi segmentami kwasów nukleinowych technikami inżynierii genetycznej. Techniki manipulacji kwasami nukleinowymi są dobrze znane (patrz np. Sambrook i wsp., Molecular Cloning, A Laboratory Manual, II wydanie, Cold Spring Harbor Press, Cold Spring Harbor, Nowy Jork, 1989 i Ausubel i wsp., 1992). Metody syntezy chemicznej kwasów nukleinowych są opisane np. przez Beaucage'a i Carruthers'a w Tetr. Letts. 22: 1859-1862 (1981) i przez Matteucci'iego i wsp. w J. Am. Chem. Soc. 103: 3185 (1981). Syntezę chemiczną kwasów nukleinowych można przeprowadzić np. w przemysłowych zautomatyzowanych syntetyzerach oligonukleotydów. "Syntetyczną sekwencję kwasu nukleinowego" można zaprojektować i zsyntetyzować chemicznie do celów wzmożonej ekspresji w określonych komórkach gospodarza i do celów klonowania do odpowiednich wektorów. Komórki gospodarza często wykazują preferencję użycia wzoru kodonów (Murray i wsp., 1989). Syntetyczne DNA zaprojektowane do celów wzmagania ekspresji w konkretnym gospodarzu powinny zatem odzwierciedlać wzór użycia kodonu w komórce gospodarza. Do tych celów są dostępne programy komputerowe, w tym między innymi programy "BestFit" lub "Gap" zawarte w pakiecie "Sequence Analysis Software Package", Genetics Computer Group, Inc., z University of Wisconsin Biotechnology Center, Madison, WI 53711. Terminy "amplifikacja" kwasów nukleinowych lub "reprodukcja kwasu nukleinowego" odnoszą się do produkcji dodatkowych kopii sekwencji kwasu nukleinowego prowadzonej z użyciem technologii łańcuchowej reakcji polimerazy (PCR). Jest wiele znanych i opisanych metod amplifikacji. Między innymi, metody te są opisane w opisach patentowych Stanów Zjednoczonych Ameryki, US 4.683.195 i US 4.683.202 oraz w protokołach PCR: A Guide to Methods and Applications (Poradnik metod i zastosowań), wyd. Innis i wsp., Academic Press, San Diego, 1990. W odniesieniu do reakcji PCR, terminem primer określa się krótki oligonukleotyd o zdefiniowanej sekwencji, który przyłącza się do matrycy DNA, inicjując łańcuchową reakcję polimerazy. Terminy "transformowany", "transfekowany" lub "transgeniczny" odnoszą się do komórki, tkanki, organu lub organizmu, do którego został wprowadzony obcy kwas nukleinowy, taki jak rekombinantowy wektor. Korzystnie, wprowadzony kwas nukleinowy ulega integracji z genomowym DNA przyjmującej komórki, tkanki, organu lub organizmu, w taki sposób, że ten wprowadzony kwas nukleinowy jest dziedziczony przez następne pokolenie. Terminy "transgeniczna" lub "transformowana" komórka lub organizm obejmują również komórki lub organizmy potomne oraz potomstwo wyprodukowane w programie hodowli stosującym taką "transgeniczną" roślinę jako organizm rodzicielski do krzyżowania, wykazujące zmieniony fenotyp, będący wynikiem obecności rekombinantowej konstrukcji lub wektora.

6 PL 204 789 B1 Termin "gen" oznacza DNA chromosomalny, DNA plazmidowy, cdna, syntetyczny DNA albo inny DNA, kodujący peptyd, polipeptyd, białko albo cząsteczkę RNA oraz regiony flankujące tę sekwencję kodującą, zaangażowane w regulowaniu ekspresji. Niektóre geny podlegają transkrypcji do mrna i translacji do polipeptydów (geny strukturalne), inne geny mogą ulegać transkrypcji do RNA (np. rrna, trna) a inne typy genów mają funkcje regulatorów ekspresji (geny regulatorowe). "Ekspresja" genu oznacza transkrypcję genu z wytworzeniem odpowiedniego mrna i translację tego mrna z wytworzeniem odpowiedniego produktu tego genu, a więc, peptydu, polipeptydu lub białka. Ekspresję genu kontrolują lub modulują elementy regulacyjne, w tym elementy regulacyjne 5', takie jak promotory. Termin "komponent genetyczny" odnosi się do każdej sekwencji kwasu nukleinowego lub elementu genetycznego, która również może być składnikiem lub częścią wektora ekspresyjnego. Przykłady komponentów genetycznych obejmują bez ograniczeń regiony promotorowe, nie podlegające translacji lidery 5', introny, geny, regiony nie podlegające translacji 3' i inne sekwencje regulacyjne albo sekwencje wpływające na transkrypcję lub translację jednej lub większej ilości sekwencji kwasu nukleinowego. Terminy: "rekombinacyjna konstrukcja DNA", "wektor rekombinacyjny", "wektor ekspresyjny" albo "kaseta ekspresyjna" odnosi się do każdego czynnika, takiego jak plazmid, kosmid, wirus, BAC (sztuczny chromosom bakteryjny), autonomicznie replikująca się sekwencja, fag lub liniowy bądź kulisty, jednoniciowy lub dwuniciowy DNA lub nukleotydowa sekwencja RNA, pochodzącego z dowolnego źródła, zdolnego do integracji z genomem lub do replikacji autonomicznej, zawierającego cząsteczkę DNA, w której jedna lub większa ilość sekwencji DNA została związana operacyjnie w sposób zapewniający funkcje biologiczne. "Komplementarny" oznacza naturalne połączenie sekwencji kwasu nukleinowego przez parowanie zasad (par A-G-T z komplementarną sekwencją T-C-A). Komplementarność między dwiema jednoniciowymi cząsteczkami może być częściowa jeśli tylko niektóre pary kwasów nukleinowych są komplementarne albo całkowita, jeśli wszystkie pary zasad są komplementarne. Stopień komplementarności wpływa na wydajność i siłę reakcji hybrydyzacji i amplifikacji. Termin "homologia" oznacza poziom podobieństwa pomiędzy sekwencjami kwasów nukleinowych lub aminokwasowymi i wyraża się ją jako procent identyczności położenia odpowiednio nukleotydu lub aminokwasu, a więc, podobieństwo lub identyczność sekwencji. Termin "homologia" odnosi się również do pojęcia podobnych właściwości funkcyjnych wśród różnych kwasów nukleinowych i białek. "EST" albo etykietki sekwencji kodujących Tag, są to krótkie sekwencje losowo wybranych klonów z biblioteki cdna (lub komplementarnego DNA), reprezentujące inserty cdna tych losowo wybranych klonów [McCombie i wsp., Nature Genetics, 1: 124, (1992), Kurata i wsp., Nature Genetics, 8: 365 (1994) i Okubo i wsp., Nature Genetics, 2: 173 (1992)]. Termin "elektroniczny Northern" oznacza komputerową analizę sekwencji, pozwalającą na elektroniczne porównanie sekwencji z wielu bibliotek cdna w oparciu o parametry podane przez badacza, w tym w oparciu o częstość występowania (rozpowszechnienie) populacji EST w wielu różnych bibliotekach cdna albo wyłącznie w oparciu o zbiory EST z jednej biblioteki lub z kombinacji bibliotek. "Analiza podzbioru" oznacza każdą metodę porównywania sekwencji kwasu nukleinowego z różnych lub z wielu źródeł, która to metoda może być użyta do zidentyfikowania profilu sekwencji kwasu nukleinowego odzwierciedlającego aktywność transkrypcyjną genu i trwałość sygnału (message stability) w konkretnej tkance, w określonym czasie lub w danych warunkach. Termin "promotor" oznacza sekwencję kwasu nukleinowego znajdującą się w górę od albo w kierunku 5' od kodonu początku translacji w ramce odczytu (albo w regionie kodującym białko) genu i która jest zaangażowana w rozpoznawaniu i wiązaniu RNA polimerazy II i innych białek (trans- -czynników transkrypcyjnych, "trans-acting factors") w celu zainicjowania transkrypcji. "Promotor roślinny" jest promotorem natywnym lub nie natywnym funkcjonującym w komórkach roślinnych. Promotory konstytutywne funkcjonują w większości lub we wszystkich tkankach roślinnych w ciągu całego cyklu rozwoju rośliny. Ekspresja promotorów swoistych tkankowo, narządowo lub komórkowo przebiega jedynie lub głównie odpowiednio w określonej tkance, narządzie lub typie komórek. Ekspresja promotora, zamiast przebiegać "swoiście" w określonej tkance, organie albo typie komórek, może przebiegać ze "wzmożoną" siłą, czyli na wyższym poziomie w jednej części rośliny (np. w typie komórek, tkance lub w organie) w porównaniu z innymi częściami tej rośliny. Promotory regulowane czasem funkcjonują jedynie lub głównie w pewnych okresach rozwoju rośliny albo w pewnych porach dnia, tak

PL 204 789 B1 7 jak się to np. dzieje w przypadku genów związanych z rytmem dobowym. Promotory indukowalne selektywnie inicjują ekspresję operacyjnie związanej sekwencji DNA w odpowiedzi na endogenny lub egzogenny bodziec, np. na związki chemiczne (induktory chemiczne) albo w odpowiedzi na sygnały środowiskowe, hormonalne, chemiczne i/lub rozwojowe. Do promotorów indukowalnych lub regulowanych należą np. promotory regulowane światłem, ciepłem, stresem, zalaniem wodą lub suszą, fitohormonami, okaleczeniem lub związkami chemicznymi, takimi jak etanol, jasmonian, kwas salicylowy lub środkami ochrony. Każdy promotor roślinny może być użyty jako sekwencja regulatorowa 5' do modulowania ekspresji szczególnego genu lub genów. Jednym z korzystnych promotorów mógłby być roślinny promotor RNA polimerazy II. Roślinne promotory RNA polimerazy II, tak jak inne z wyższych organizmów eukariotycznych, posiadają skomplikowane struktury i są złożone z kilku oddzielnych elementów. Jednym z takich elementów jest skrzynka TATA albo skrzynka Goldberga-Hognessa, niezbędna dla prawidłowej ekspresji genów eukariotycznych in vitro i precyzyjnej, wydajnej inicjacji transkrypcji in vivo. Skrzynka TATA jest typowo usytuowana w pozycji około -25 do -35, to znaczy, w miejscu od 25 do 35 pary zasad (bp) w górę (5') od miejsca inicjacji transkrypcji albo miejsca cup, które określa się jako pozycję +1 [Breathnach i Chambon, Ann. Rev. Biochem. 50: 349-383 (1981), Messing i wsp. w publikacji: Genetic Engineering of Plants, wyd. Kosuge i wsp., str. 211-227 (1983)]. Inny element wspólny, skrzynka CCAAT, jest zlokalizowana pomiędzy -70 a -100 parą zasad. W roślinach, skrzynka CCAAT może mieć sekwencję consensus inną niż analogiczna funkcjonalnie sekwencja w promotorach ssaków (analogiczna skrzynka w roślinach jest nazwana "skrzynką AGGA" dla odróżnienia jej od odpowiednika u zwierząt [Messing i wsp. w publikacji: Genetic Engineering of Plants, wyd. Kosuge i wsp., str. 211-227 (1983)]. Poza tym, rzeczywiście wszystkie promotory zawierają dodatkowe sekwencje aktywujące albo wzmacniacze znajdujące się w kierunku 5" [Benoist i Chambon, Nature 290: 304-310 (1981), Gruss i wsp., Proc. Nat. Acad. Sci. USA 78: 943-947 (1981) i Khoury i Gruss, Cell 27: 313-314 (1983)], rozciągające się od około -100 pary zasad do -1000 pary zasad albo bardziej w górę od miejsca inicjacji transkrypcji. Po fuzji z heterologicznymi sekwencjami DNA, promotory takie na ogół powodują, że przyłączona sekwencja podlega transkrypcji w sposób podobny do transkrypcji sekwencji genu, z którym promotor ten jest związany w stanie naturalnym. Można dodać fragmenty promotora zawierające sekwencje regulacyjne (np. przyłączony przez fuzję do jego końca 5' albo wbudowany do niego przez insercję, aktywny promotor posiadający własne częściowe lub całkowite sekwencje regulacyjne [Fluhr i wsp., Science 232: 1106-1112 (1986), Ellis i wsp., EMBO J. 6: 11-16 (1987), Strittmatter i Chua, Proc. Nat. Acad. Sci. USA 84: 8986-8990 (1987), Poulsen i Chua, Mol. Gen. Genet. 214: 16-23 (1988), Comai i wsp., Plant Mol. Biol. 15: 373-381 (1991)]. Alternatywnie, można dodać heterologiczne sekwencje regulatorowe w kierunku 5', do regionu 5' nieaktywnego promotora skróconego, np. promotora zawierającego jedynie rdzeń TATA i czasami elementy CCAAT [Fluhr i wsp., Science 232: 1106-1112 (1986), Strittmatter i Chua, Proc. Nat. Acad. Sci. USA 84: 8986-8990 (1987), Aryan i wsp., Mol. Gen. Genet. 225: 65-71 (1991)]. Promotory na ogół składają się z wielu odrębnych elementów cis ("cis-acting elements") regulujących transkrypcję albo po prostu "elementów cis". Każdy z tych elementów wydaje się nadawać inny aspekt w ogólnej kontroli ekspresji genu [Strittmatter i Chua, Proc. Nat. Acad. Sci. USA 84: 8986-8990 (1987), Ellis i wsp., EMBO J. 6: 11-16 (1987), Benfey i wsp., EMBO J. 9: 1677-1684 (1990)]. Elementy cis wiążą czynniki białkowe trans ("trans-acting factors") regulujące transkrypcję. Niektóre elementy cis wiążą więcej niż jeden czynnik, natomiast czynniki transkrypcji trans mogą wchodzić w reakcję z różnym powinowactwem z więcej niż jednym elementem cis [Johnson i McKnight, Ann. Rev. Biochem. 58: 799-839 (1989)]. Roślinne czynniki transkrypcyjne odpowiadające elementom cis oraz analiza ich działania są opisane np. w publikacjach: Martin, Curr. Opinions Biotech. 7: 130-138 (1996), Murai, Methods in Plant Biochemistry and Molecular Biology, wyd. Dashek, CRC Press (1997), str. 397-422 i Methods in Plant Molecular Biology, wyd.: Maliga i wsp., Cold Spring Harbor Press (1995), str. 233-300. Sekwencje promotorowe według wynalazku mogą zawierać "elementy cis", które mogą powodować lub modulować ekspresję genu. Elementy cis można identyfikować wieloma technikami, w tym analizą przez delecję, to znaczy, usuwając jeden lub większą ilość nukleotydów z końca 5' albo z wewnętrznej części promotora, analizą białka wiążącego DNA z użyciem "odcisku palca" DNA-zy I, interferencji metylowania, przesunięcia pasm w próbach elektroforezy, genomowego "odcisku palca" in vivo w reakcji PCR z udziałem reakcji

8 PL 204 789 B1 ligacji i innymi dogodnymi analizami bądź też, metodami analizy podobieństwa sekwencji ze znanymi motywami elementu cis, znanymi metodami porównania sekwencji. Dokładna struktura elementu cis może być przedmiotem dalszych badań przez mutagenezę (lub substytucję) jednego lub większej ilości nukleotydów albo innymi znanymi metodami [Methods in Plant Biochemistry and Molecular Biology, wyd. Dashek, CRC Press (1997), str. 397-422 i Methods in Plant Molecular Biology, wyd.: Maliga i wsp., Cold Spring Harbor Press (1995), str. 233-300]. Elementy cis można otrzymać przez syntezę chemiczną albo przez klonowanie z promotorów, które zawierają te elementy i można je syntetyzować z dodatkowymi sekwencjami flankującymi zawierającymi użyteczne miejsca dla enzymów restrykcyjnych, dla ułatwienia następnych manipulacji. W jednym rozwiązaniu, promotory te składają się z wielu odrębnych elementów cis regulujących transkrypcję albo po prostu "elementów cis", z których każdy wydaje się nadawać inny aspekt w ogólnej kontroli ekspresji genu [Strittmatter i Chua, Proc. Nat. Acad. Sci. USA 84: 8986-8990 (1987), Ellis i wsp., EMBO J. 6: 11-16 (1937), Benfey i wsp., EMBO J. 9: 1677-1684 (1990)]. W korzystnym rozwiązaniu, regiony sekwencji zawierające "elementy cis" z sekwencji kwasu nukleinowego SEQ ID nr. 53-75 identyfikuje się z użyciem programów komputerowych zaprojektowanych specjalnie do identyfikacji elementów cis albo domen bądź motywów w obrębie tych sekwencji. Niniejszym wynalazkiem są objęte elementy cis w sekwencjach SEQ ID nr. 53-75 albo homologi elementów cis, o których wiadomo, że mają udział w regulacji genu i wykazują homologię z sekwencjami kwasu nukleinowego według wynalazku. W piśmiennictwie znanych jest wiele tego rodzaju elementów, takich jak elementy regulowane wieloma czynnikami, takimi jak światło, ciepło lub stres, elementy regulowane lub indukowane przez patogeny lub środki chemiczne i podobnych. Takie elementy mogą albo pozytywnie albo negatywnie regulować ekspresję genu, zależnie od warunków. Przykłady elementów cis obejmują między innymi, elementy reagujące na tlen [Cowen i wsp., J. Biol. Chem. 268 (36): 26904 (1993)], elementy regulacyjne reagujące na światło [patrz np. Bruce i Quaill, Plant Cell 2(11): 1081 (1990) i Bruce i wsp., EMBO J. 10: 3015 (1991)], element cis wrażliwy na traktowanie jasmonianem metylu [Beaudoin i Rothstein, Plant Mol. Biol. 33: 835 (1997)], elementy reagujące na kwas salicylowy [Strange i wsp., Plant J. 11: 1315 (1997)], elementy reagujące na szok cieplny [Pelham i wsp., Trends Genet. 1: 31 (1985)], elementy wrażliwe na okaleczenie i stres abiotyczny [Loace i wsp., Proc. Nat. Acad. Sci. USA 89: 9230 (1992), Mhiri i wsp., Plant Mol. Biol. 33: 257 (1997)], elementy reagujące na niską temperaturę (Backer i wsp., Plant Mol. Biol. 24: 701 (1994), Jiang i wsp., Plant Mol. Biol. 30: 679 (1996), Nordin i wsp., Plant Mol. Biol. 21: 641 (1993), Zhou i wsp., J. Biol. Chem. 267: 23515 (1992)] i elementy reagujące na susze (Yamaguchi i wsp., Plant Cell 6: 251-264 (1994), Wang i wsp., Plant Mol. Biol. 28: 605 (1995), Bray E. A., Trends in Plant Science 2: 48 (1997)]. Przedmiotem wynalazku są zatem objęte fragmenty lub "elementy cis" ujawnionych cząsteczek kwasu nukleinowego i te fragmenty kwasu nukleinowego mogą zawierać dowolny region ujawnionych sekwencji. Regiony promotorowe albo częściowe regiony promotorowe według wynalazku przedstawione na SEQ ID nr. 53-75 mogą zawierać jeden lub większą ilość elementów regulacyjnych, obejmujących między innymi "elementy cis" albo domeny zdolne do regulowania transkrypcji związanych operacyjnie sekwencji DNA w wielu tkankach. Promotory roślinne mogą obejmować promotory wytwarzane przez manipulację znanych promotorów, z wytworzeniem promotorów syntetycznych, chimerycznych lub hybrydowych. W takich promotorach mogą być również zblokowane elementy cis z jednego lub z większej ilości promotorów, np. w wyniku dodania do aktywnego promotora heterologicznej sekwencji regulatorowej z jej własnymi częściowymi lub całkowitymi sekwencjami regulacyjnymi [Ellis i wsp., EMBO J. 6: 11-16 (1987), Strittmatter i Chua, Proc. Nat. Acad. Sci. USA 84: 8986-8990 (1987), Poulsen i Chua, Mol. Gen. Genet. 214: 16-23 (1988), Comai i wsp., Plant Mol. Biol. 15: 373-381 (1991)]. Opracowano również promotory chimeryczne przez dodanie heterologicznej sekwencji regulacyjnej w kierunku 5' do regionu 5' nieaktywnego promotora skróconego, to znaczy, do promotora, który zawiera tylko rdzeń TATA i ewentualnie elementy CCAAT [Fluhr i wsp., Science 232: 1106-1112 (1986), Strittmatter i Chua, Proc. Nat. Acad. Sci. USA 84: 8986-8990 (1987), Aryan i wsp., Mol. Gen. Genet. 225: 65-71 (1991)]. Projektowanie, konstruowanie i użycie chimerycznych lub hybrydowych promotorów zawierających co najmniej jeden element cis z SEQ ID nr. 69 do modulowania ekspresji związanych operacyjnie sekwencji kwasu nukleinowego jest również objęte wynalazkiem. Promotorowe sekwencje, fragmenty, regiony i elementy cis z sekwencji SEQ ID nr. 69 mają zdolność transkrybowania związanych z nimi operacyjnie sekwencji DNA w wielu tkankach i mogą

PL 204 789 B1 9 selektywnie regulować ekspresję genów w tych tkankach. W odniesieniu do szeregu cech agronomicznych, ekspresja żądanego genu lub genów jest pożądana w wielu tkankach dla nadania żądanych cech. Dostępność odpowiednich promotorów regulujących transkrypcję operacyjnie związanych genów w określonych, docelowych żądanych tkankach ma duże znaczenie, gdyż może się okazać, że ekspresja powinna przebiegać nie we wszystkich tkankach lecz tylko w niektórych. Dla przykładu, jeśli potrzebna jest kontrola szkodników owadzich atakujących pewne tkanki, wówczas będzie pożądana ekspresja produktu żądanego genu w tych tkankach. Dla nadania cechy odporności na herbicydy, może się okazać pożądane posiadanie promotora inicjującego transkrypcję operacyjnie związanych genów w sposób, który nadaje cechę odporności na herbicyd na żądanych poziomach zarówno w tkankach wegetatywnych jak i reprodukcyjnych. Tak więc, ważne jest aby dysponować szerokimi możliwościami wyboru elementów regulacyjnych 5' dla każdej strategii stosowanej w biotechnologii roślin. Narodzenie się genomiki, która obejmuje techniki molekularne i bioinformatyczne, zaowocowało szybkim sekwencjonowaniem i analizami ogromnej ilości próbek DNA pochodzących z ogromnej ilości celi, w tym również, między innymi, z gatunków roślin o dużym znaczeniu agronomicznym. Dla identyfikacji sekwencji kwasu nukleinowego według wynalazku z bazy danych lub z kolekcji sekwencji cdna, w pierwszym etapie konstruuje się biblioteki cdna z określonych tkanek roślinnych będących celem badań. Pokrótce, na początku konstruuje się biblioteki cdna z tych tkanek, które zostały zebrane w określonym stadium rozwoju albo w określonych warunkach środowiska. Przez identyfikację genów podlegających w tkankach roślinnych zróżnicowanej ekspresji w różnych stadiach rozwojowych albo w różnych warunkach, można zidentyfikować i izolować odpowiednie sekwencje regulacyjne dla tych genów. Obrazowanie transkryptu umożliwia identyfikację sekwencji preferowanych przez tkanki w oparciu o swoiste obrazowanie sekwencji kwasu nukleinowego z biblioteki cdna. Pod terminem "obrazowanie transkryptu" rozumie się analizę porównującą częstość występowania (rozpowszechnienie) genów podlegających ekspresji w jednej lub w kilku bibliotekach. Klony zawarte w bibliotece cdna sekwencjonuje się i porównuje się uzyskane sekwencje z sekwencjami w bazach powszechnie dostępnych. Metody komputerowe pozwalają badaczowi na wprowadzenie pytań (parametrów), na podstawie których porównywane są sekwencje z wielu bibliotek. Ten proces umożliwia szybką identyfikację poszukiwanych klonów w porównaniu z tradycyjnymi metodami eliminowania przez hybrydyzację, znanymi specjalistom. Stosując znane metodologie, można skonstruować biblioteki cdna z mrna (informacyjnego RNA) z danej tkanki lub organizmu, stosując primery dt i odwrotną transkryptazę [Efstratiadis i wsp., Celi 7: 279 (1976), Higuchi i wsp., Proc. Natl. Acad. Sci. USA 73: 3146 (1976), Maniatis i wsp., Cell 8: 163 (1976), Land i wsp., Nucleic Acids Res. 9: 2251 (1981), Okayama i wsp., Mol. Cell Biol. 2: 161 (1982), Gubler i wsp., Gene 25: 263 (1983)]. Dla uzyskania konstrukcji cdna o pełnej długości można wykorzystać szereg metod. Dla przykładu, można użyć terminalną transferazę w celu dodania ogonów homopolimerowych złożonych z reszt dc do wolnych grup hydroksylowych 3' [Land i wsp., Nucleic Acids Res. 9: 2251 (1981)]. Te ogony można następnie poddać hybrydyzacji z poli dg oligo, który może służyć jako primer do syntezy drugiej nici cdna o pełnej długości. Okayama i Berg opisali sposób otrzymywania konstrukcji cdna o pełnej długości. Sposób ten został uproszczony przez użycie syntetycznych primerów-adaptorów posiadających zarówno ogony homopolimerowe służące jako primery do syntezy pierwszej i drugiej nici, jak i miejsca restrykcyjne do klonowania do wektorów plazmidowych [Coleclough i wsp., Gene 34: 305 (1985)] i bakteriofagowych [Krawinkel i wsp., Nucleic Acids Res. 14: 1913 (1986) i Han i wsp. Nucleic Acids Res. 15: 6304 (1987)]. Do celów izolowania rzadkich populacji mrna można połączyć powyższe strategie ze strategiami dodatkowymi. Przykładowo, typowa komórka ssaka zawiera od 10000 do 30000 różnych sekwencji mrna [Davidson, Gene Activity in Early Development, II wyd., Academic Press, Nowy Jork (1976)]. Dla uzyskania określonego prawdopodobieństwa, że mrna o niskiej częstości występowania będzie obecny w bibliotece cdna, ilość klonów musi wynosić N = [In(1-P)]/[ln(1-1/n)], gdzie N oznacza liczbę wymaganych klonów, P oznacza żądane prawdopodobieństwo a 1/n oznacza proporcję frakcji całkowitego mrna do jednego rzadkiego mrna (Sambrook i wsp., 1989). Jedną z metod wzbogacania preparatów mrna w sekwencje żądane jest frakcjonowanie według wielkości. Jedną z takich technik jest frakcjonowanie metodą elektroforezy w żelu agarozowym [Pennica i wsp., Nature 301: 214 (1983)].

10 PL 204 789 B1 W innej technice stosuje się wirowanie w gradiencie sacharozy wobec czynnika, takiego jak wodorotlenek metylortęciowy, który deneturuje strukturę drugorzędową w RNA [Schweinfest i wsp., Proc. Natl. Acad. Sci. USA 79: 4997-5000 (1982)]. Często stosowaną metodą jest konstruowanie bibliotek cdna zrównanych lub znormalizowanych [Ko, Nucleic Acids Res. 18: 5705 (1990), Patanjali S. R. i wsp., Proc. Natl. Acad. Sci. USA 88: 1943 (1991)]. Na ogół, populację cdna normalizuje się przez hybrydyzację odejmującą [Schmid i wsp., J. Neurochem. 48: 307 (1987), Fargnoli i wsp., Anal. Biochem. 187: 364 (1990), Travis i wsp., Proc. Natl. Acad. Sci. USA 85: 1696 (1988), Kato, Eur. J. Neurosci. 2: 704 (1990) i Schweinfest i wsp., Genet. Anal. Tech. Appl. 7: 64 (1990)]. Odejmowanie jest inną metodą ograniczania populacji niektórych sekwencji w bibliotece cdna [Swaroop i wsp., Nucleic Acids Res. 19: 1954 (1991)]. Znormalizowane biblioteki można kostruować wykorzystując procedurę Scares'a (Scares i wsp., Proc. Natl. Acad. Sci. USA 91: 9228 (1994)]. To podejście jest przeznaczone do obniżania początkowego zróżnicowania 10000-krotnego w poszczególnych częstościach występowania cdna potrzebnych do osiągnięcia częstości występowania w granicach jednego rzędu wielkości, przy jednoczesnym utrzymaniu pełnej złożoności sekwencji w tej bibliotece. W procesie normalizacji, przewaga klonów cdna o dużej częstości występowania obniża się gwałtownie, klony o średnim poziomie liczebności pozostają w zasadzie niezmienione a liczebność klonów dla rzadkich transkryptów efektywnie się zwiększa. Analizę sekwencji EST można prowadzić wieloma metodami. Do sekwencjonowania DNA można stosować dwie podstawowe metody, metodę terminacji łańcucha opracowaną przez Sangera i wsp. [Proc. Natl. Acad. Sci. USA 74: 5463 (1977)] i metodę degradacji chemicznej Maxam'a i Gilberta [Proc. Natl. Acad. Sci. USA 74: 560 (1977)]. Automatyzacja i postęp w technologii, np. zastąpienie sekwencjonowania z użyciem radioizotopów w metodach opartych na fluorescencji, zmniejszyły uciążliwość sekwencjonowania DNA [Craxton, Methods, 2: 20 (1991), Ju i wsp., Proc. Natl. Acad. Sci. USA 92: 4347 (1995), Tabor i Richardson, Proc. Natl. Acad. Sci. USA, 92: 6339 (1995)]. Automatyczne aparaty do sekwencjonowania dostawcza wielu wytwórców, np. Pharmacia Biotech, Inc., Piscataway, New Jersey (Pharmacia ALF), LI-COR, Inc., Lincoln, Nebraska (LI-COR 4000) i Millipore, Berdford, Massachusetts (Millipore BaseStation). Sekwencje EST dłuższe od 150 par zasad okazały się użyteczne do badań podobieństwa i mapowania [Adams i wsp., Science 252: 1651 (1991)]. Sekwencje EST mają na ogół długość od 150 do 450 zasad. Jest to ta długość sekwencji, która zapewnia informację o sekwencji, która jest rutynowo i rzetelnie generowana w pojedynczym przebiegu sekwencjonowania. Na ogół, Z biblioteki cdna wyprowadza się dane na podstawie tylko jednego przebiegu sekwencjonowania [Adams i wsp., Science 252: 1651 (1991)]. Automatyczny pojedynczy przebieg sekwencjonowania daje wyniki na ogół z błędem lub stopniem jednoznaczności zasad wynoszącym około 2-3% (Boguski i wsp., Nature Genetics, 4: 332 (1993). Bazy danych o EST konstruuje się lub częściowo konstruuje się np. z C. elegans (McCombrie i wsp., Nature Genetics 1: 124, 1992), z ludzkiej linii komórek wątrobowych HepG2 (Okubo i wsp., Nature Genetics 2: 173, 1992), z RNA mózgu człcwieka (Adams i wsp., Science 252: 1651, 1991; Adams i wsp., Nature 355: 632, 1992) z Arabidopsis (Newman i wsp., Plant Physiol. 106: 1241, 1994) i z ryżu (Kurata i wsp., Nature Genetics 8: 365, 1994). W niniejszym wynalazku, jako narzędzie do identyfikacji genów podlegających ekspresji w żądanych tkankach stosuje się EST z wielu bibliotek sporządzonych z wielu tkanek kukurydzy, i dzięki temu ułatwia się izolację sekwencji regulatorowych 5', takich jak promotory, które regulują geny. Do identyfikacji sekwencji, których ekspresja jest zróżnicowana, w tym sekwencji (lecz nie tylko takich sekwencji), których ekspresja przebiega w jednej tkance w porównaniu do ekspresji w innej tkance, można zastosować komputerowe analizy sekwencji. Przykładowo, inny zbiór sekwencji można wyprowadzić z cdna wyizolowanego z tkanki roślinnej korzeni a inny z tkanki liścia. Można również porównywać sekwencje z bibliotek cdna sporządzonych z roślin rosnących w różnych warunkach środowiskowych lub fizjologicznych. Po zidentyfikowaniu preferowanych sekwencji z żądanej biblioteki cdna, można wyizolować klony genomowe z biblioteki genomowej przygotowanej z tej tkanki roślinnej, po czym identyfikować i izolować odpowiednie sekwencje regulatorowe, w tym również, chociaż nie wyłącznie, sekwencje regulatorowe 5'. W jednym z korzystnych rozwiązań, kataloguje się w bazie danych o sekwencjach etykietki sekwencji kodujących tag (EST) z wielu różnych bibliotek cdna. Tę bazę danych stosuje się do identyfikacji poszukiwanych promotorów z konkretnej, badanej tkanki. Wyboru etykietek sekwencji kodujących tag do następnej izolacji promotora dokonuje się na podstawie obecności jednej lub

PL 204 789 B1 11 większej ilości sekwencji spośród reprezentatywnych EST pochodzących z losowego pobierania próbek z indywidualnej biblioteki cdna albo z kolekcji bibliotek cdna. Dla przykładu, identyfikację sekwencji regulatorowych, regulujących ekspresję transkryptów w tkance liści i korzeni prowadzi się przez identyfikację EST znajdujących się w bibliotekach cdna z liści i z korzeni a nieobecnych albo występujących nielicznie w innych bibliotekach cdna i określa się profil ekspresji dla danej EST. Termin "częstość występowania", w znaczeniu tu użytym, oznacza, ile razy klon lub zgrupowanie klonów pojawia się w bibliotece. W ten sposób identyfikuje się sekwencje, które są wzmocnione lub występują bardzo licznie w określonej tkance lub w organie, które to sekwencje reprezentują docelowy profil ekspresji i z tych zidentyfikowanych sekwencji EST projektuje się primery. Do amplifikacji regionów flankujących z genomowej biblioteki badanej rośliny można zastosować techniki oparte na reakcji PCR. Specjalistom z tej dziedziny znanych jest wiele metod amplifikacji nieznanych sekwencji DNA sąsiadujących z regionem rdzeniowym sekwencji znanej. Do metod tych należą między innymi PCR inwersyjna (IPCR), PCR wektorowa (vectorette PCR), PCR-Y (Yshaped PCR) i metoda "spaceru po genomie". W korzystnym rozwiązaniu, genomowy DNA, zligowany z sekwencją adaptorową poddaje się pierwszej reakcji amplifikacji PCR, stosując primer swoisty dla genu i primer, który łączy się z sekwencją adaptorową. Produkt tej reakcji PCR stosuje się następnie jako matrycę do gniazdowej amplifikacji PCR z użyciem drugiego primera swoistego dla genu i drugiego adaptora. Fragmenty uzyskane z gniazdowej reakcji PCR izoluje się, oczyszcza i subklonuje do odpowiedniego wektora. Fragmenty sekwencjonuje się i identyfikuje się miejsca startu translacji wówczas, gdy EST pochodzi ze skróconego cdna. Fragmenty te można klonować do roślinnych wektorów ekspresyjnych jako fuzje transkrypcyjne lub translacyjne z genem reporterowym, takim jak gen β-glukuronidazy (GUS). Konstrukty te można testować w analizach przejściowych i następnie wiązać operacyjnie regiony 5'-regulatorowe z innymi genami i sekwencjami regulacyjnymi będącymi przedmiotem zainteresowania w odpowiednim roślinnym wektorze transformacyjnym i analizować transformowane rośliny na ekspresję żądanego genu (żądanych genów) wieloma metodami znanymi specjalistom. Do identyfikacji genów i sekwencji regulatorowych można wybrać każdą roślinę. Przykłady odpowiednich roślin docelowych do izolacji genów i sekwencji regulatorowych obejmują między innymi, Acadia, lucernę, jabłonie, morele, Arabidopsis, karczochy, arugulę, szparagi, avocado, banany, jęczmień, fasolę, buraki, jeżynę, czarną jagodę, czarną borówkę amerykańską, brokuły, brukselkę, kapustę, canolę, cantaloupe (odmiana Cucumic melo cantalupensis), marchew, kasawę, rycynus, kalafiory, selery, czereśnie, cykorię, cilantro (pol. kolendrę siewną), cytrusy, klementynki, koniczynę, kokosy, kawę, kukurydzę, bawełnę, ogórki, jodłę Douglasa, bakłażany, cykorię jadalną, eskarolę, eukaliptus, koper włoski, figi, czosnek, tykwę, winorośl, grapefruity, słodką rosę, Ipomoea jicama, kiwi, sałatę, pory, drzewo cytrynowe, limonę, sosnę amerykańską Loblolly, siemię lniane, mango, melony, grzyby jadalne, brzoskwinie, orzechy, owies, palmę olejową, rzepak, piżmian jadalny, drzewo oliwkowe, cebulę, pomarańcze, rośliny ozdobne, palmę, papaję, pietruszkę, pasternak, groch, śliwę brzoskwiniową, orzechy arachidowe, gruszę, pieprz, śliwę daktylową, sosnę, ananasy, babkę zwyczajną, śliwę, granaty, topolę, ziemniaki, dynię zwyczajną, pigwę, sosnę promieniową, radiscchio, rzodkiew, rzepak, maliny, ryż, żyto, sorgo, sosnę południową, soję, szpinak, dynię, truskawki, buraki cukrowe, trzcinę cukrową, słoneczniki, słodkie ziemniaki, Liquidambar styraciflua, mandarynki, herbatę, tytoń, pomidory, triticale, darń, rzepę polną, winorośl, arbuzy, pszenicę, słodkie ziemniaki i cukinię. Do szczególnie korzystnych celów roślinnych należą kukurydza, bawełna, soja i pszenica. Cząsteczki kwasu nukleinowego według wynalazku izoluje się z kukurydzy (Zea mays). Roślina kukurydzy wydaje około 20-21 liści, wiechy po około 65 dniach od wzejścia i dojrzewa po 125 dniach od wzejścia. Normalne rośliny kukurydzy podlegają ogólnym prawidłom rozwoju, jednak występują różnice w odstępach czasu pomiędzy różnymi stadiami i w morfologii różnych hybryd oraz u roślin rosnących w różnych warunkach wzrostu i środowiskowych. Rozróżnia się szereg dających się zidentyfikować faz rozwoju rośliny kukurydzy. Fazy te dzieli się na wegetatywne (V) i reprodukcyjne (R). Fazy V dzielą się na podfazy, oznaczane numerami V1, V2, V3 i tak dalej, do V(n), gdzie (n) oznacza stadium ostatniego liścia przed pojawieniem się kwiatostanu męskiego (VT). Pierwszą fazą V jest stadium kiełkowania (VE). Dla przykładu, VE oznacza stadium kiełkowania z gleby liścia młodej siewki, V1 oznacza stadium pierwszego normalnego liścia, V2 oznacza stadium drugiego liścia i tak dalej. Fazy reprodukcyjne obejmują okres między pierwszym pojawieniem się wiechy a dojrzewaniem nasion. Są to stadia następujące: R1 - tworzenie się wiechy,

12 PL 204 789 B1 R2 - tworzenie się ziarniaków w kolbach, R3 - stadium dojrzałości mlecznej, R4 -stadium dojrzałości woskowej, R5 - stadium powstawania zębów i R6 - stadium dojrzałości fizjologicznej (patrz np. Ritchie SW i wsp., How a Corn Plant Develops (Jak rozwija się roślina kukurydzy), Iowa State University of Science and Technology Cooperative Extension Service, Ames, IA 48: 1-21, 1986). Każdy typ tkanki roślinnej można użyć jako tkankę doceiową do identyfikacji genów i związanych z nimi elementów regulatorowych, w tym sekwencji promotorowych. W niniejszym wynalazku stosuje się liczne tkanki kukurydzy. Bardziej korzystnie, do identyfikacji sekwencji promotorowych, jako tkanki docelowe stosuje się merystem (tkankę twórczą), niedojrzały kwiatostan męski, liście, korzenie, blednące sadzonki, pochwy, pierwsze pędy, kolby, wiechy i bielmo. Do wyizolowania genów lub żądanych sekwencji regulatorowych można wykorzystać dowolny sposób pozwalający na różnicujące porównanie różnych typów lub klas sekwencji. Przykładowo, w jednym podejściu różnicowego przesiewania, bibliotekę cdna z mrna wyizolowanego z określonej tkanki można sporządzić w gospodarzu bakteriofagowym, wykorzystując dostępny w handlu zestaw do klonowania. Następnie bakteriofagi wysiewa się na płytki zawierające warstwę gospodarza bakteryjnego, takiego jak E. coli, dla wygenerowania łysinek bakteriofagów. Na błony wiążące DNA można przenieść około 105-106 łysinek. Duplikaty błon poddaje się sondowaniu, stosując sondy generowane z mrna pochodzącego z tkanki docelowej i nie docelowej albo z tkanki tła. Sondy znakuje się, co ułatwia wykrywanie po hybrydyzacji i wywołaniu błon. Do dalszej analizy można wyselekcjonować te łysinki, które hybrydyzują z sondami pochodzącymi z docelowej tkanki ale nie hybrydyzują z sondami pochodzącymi z tkanki nie docelowej, a więc wykazują pożądany zróżnicowany wzór ekspresji. Z wybranych gatunków można również sporządzić biblioteki genomowego DNA, przez częściowe trawienie enzymem restrykcyjnym i selekcję fragmentów tego DNA według wielkości, w danym zakresie wielkości. Taki genomowy DNA można klonować do odpowiedniego wektora, między innymi do bakteriofaga i preparować go w odpowiednim zestawie opisanym wcześniej (patrz np. Strafagene, La Jolla, CA albo Gibco BRL, Gaithersburg, MD). Opisane powyżej techniki hybrydyzacji różnicowej są dobrze znane specjalistom. Można je stosować do izolowania żądanych klas sekwencji. Terminem "klasy sekwencji" określa się w niniejszym opisie sekwencje, które można zgrupować w oparciu o wspólną cechę identyfikacyjną, w tym również, między innymi, sekwencje wyizolowane z tej samej docelowej rośliny, ze wspólnej biblioteki albo ze wspólnego typu tkanki roślinnej. W korzystnym rozwiązaniu, identyfikuje się sekwencje będące przedmiotem zainteresowania w oparciu o analizę sekwencji i przeszukiwanie (przez stawianie pytań) kolekcji różnych sekwencji cdna z bibliotek różnych typów tkanek. Ten ujawniony sposób jest przykładem podejścia różnicowego przesiewania opartego na elektronicznych analizach roślinnych sekwencji EST pochodzących z różnych bibliotek cdna. Szereg metod stosowanych do oceny ekspresji genu jest opartych na oznaczaniu poziomu mrna w próbce narządu, tkanki lub komórki. Do typowych metod należą między innymi blottingi mr- NA, próby zabezpieczenia przed rybonukleazą i poprzedzona odwrotną transkrypcją łańcuchowa reakcja polimerazy (RT-PCR). W innym korzystnym rozwiązaniu, stosuje się wysokowydajną metodę, w której sekwencje regulatorowe identyfikuje się na podstawie oznaczenia profilu transkryptu. Rozwój technologii mikropaneli cdna daje możliwość systematycznego monitorowania profili ekspresji genu dla tysięcy genów (Schena i wsp., Science 270: 467, 1995). W tej technologii "chip-based", szereguje się tysiące sekwencji cdna na powierzchni nośnika. Szeregi jednocześnie hybrydyzuje się z wieloma wyznakowanymi sondami cdna przygotowanymi z próbek RNA z różnych typów komórek lub tkanek, co pozwala na bezpośrednią, porównawczą analizę ekspresji. Tę technologię po raz pierwszy zademonstrowano na przykładzie analizy 48 genów Arabidopsis na zróżnicowaną ekspresję w korzeniach i w pędach (Schena i wsp., Science 270: 467, 1995). Bardziej współcześnie, monitorowano profile ekspresji ponad 1400 genów z użyciem mikropaneli cdna (Ruan i wsp., The Plant Journal 15: 821, 1998). Mikropanele dostarczają wysokowydajnej, ilościowej i powtarzalnej metody analizowania ekspresji genu i charakteryzowania funkcji genu. Podejście polegające na oznaczeniu profilu transkryptu z użyciem mikropaneli dostarcza innego cennego narzędzia do izolowania sekwencji regulatorowych, takich jak promotory związane z tymi genami. W niniejszym wynalazku stosuje się wysokowydajną analizę sekwencji, tworząc fundamenty szybkiej, komputerowej identyfikacji sekwencji będących przedmiotem zainteresowania. Specjalistom znane są środki dostępne do analizy sekwencji. Porównania sekwencji można dokonać przez oznaczenie podobieństwa sekwencji badanej lub poszukiwanej z sekwencjami dostępnymi w publicznie