Nowoczesne systemy ekspresji genów
Ekspresja genów w organizmach żywych
GEN - pojęcia podstawowe promotor sekwencja kodująca RNA terminator gen Gen - odcinek DNA zawierający zakodowaną informację wystarczającą do wytworzenia jednego rodzaju białka (definicja jest prawdziwa w odniesieniu do większości genów komórki, ale istnieją też geny, które kodują na przykład cząsteczki rrna i trna) Cistron - sekwencja kodująca RNA, której ekspresja prowadzi do powstania pojedynczego łańcucha polipeptydowego
GEN - pojęcia podstawowe Promotor Część genu, do której przyłączają się czynniki transkrypcyjne i polimeraza RNA. Jest jedną z części regulatorowych genu. Od przyłączenia polimerazy RNA do promotora rozpoczyna się transkrypcja Terminator Odcinek genu, na którym kończy się transkrypcja
GEN - pojęcia podstawowe Sekwencje regulatorowe części genu, które nie zawierają informacji genetycznej, ale kierują jej odczytywaniem wzmacniacze ekspresji (Wz) wygaszacze ekspresji (Wy) inne - niezwiązane z działaniem czynników transkrypcyjnych, np. sekwencje liderowe DNA
Ekspresja genów Ekspresja genów może zachodzić z różną wydajnością w zależności od środowiska i warunków gen a gen b A A A A A A B
Ekspresja genów w organizmach prokariotycznych i eukariotycznych Prokariota Transkrypcja Transkrypcja jest połączona z translacją Geny transkrybowane są przez jeden rodzaj polimerazy RNA Pod kontrolą jednego promotora może znajdować się więcej niż jeden cistron taką jednostkę ekspresyjną nazywamy operonem Eukariota Transkrypcja Transkrypcja jest rozdzielona od translacji Geny są transkrybowane przez trzy różne polimerazy RNA Pod kontrolą jednego promotora znajduje się jeden cistron
Systemy ekspresji (nadekspresji) genów
Nadekspresja białek - sens zastosowania Eksperyment badanie represora lac 10 cząstek białka w jednej komórce 1 μmol cząsteczek potrzebny do badań biochemicznych 1 μmol = 6x10 17 cząsteczek białka Czyli do eksperymentu potrzeba 6x10 16 komórek 1 litr hodowli E. coli w fazie stacjonarnej zawiera ~4x10 11 komórek Czyli (zakładając 100% wydajność procesu oczyszczania) 1 μmol represora lac = 150000 litrów hodowli E. coli
Zastosowanie Badania podstawowe: określenie struktury białek (NMR, krystalografia) enzymologia manipulacje genetyczne (mutageneza) badanie oddziaływań międzycząsteczkowych Zastosowania terapeutyczne i komercyjne: medycyna diagnostyka przemysł chemiczny przemysł spożywczy
Schemat postępowania Klonowanie eukariotycznego cdna lub genu prokariotycznego (Przeklonowanie sekwencji do wektora ekspresyjnego) Przeniesienie konstruktu do komórek gospodarza/komórek Charakterystyka produktu (białka): oczyszczanie testy enzymatyczne
Przygotowanie do eksperymentu Wybór gospodarza systemy in vivo (przykłady) Escherichia coli Saccharomyces cerevisiae Pichia pastoris hodowla tkankowa komórek ssaczych organizmy transgeniczne wyspecjalizowane systemy in vitro
Przygotowanie do eksperymentu Wybór wektora wydajność sposób oczyszczania modyfikacje potranslacyjne konieczność przeprowadzenia modyfikacji genu/cdna koszt stopień trudności
http://www.biotechnantes.com/conferences/business%201/jeudi/14h00/02%20thiry.pdf#search=%22protein%20expression%20systems%20ppt%22
http://www.biotechnantes.com/conferences/business%201/jeudi/14h00/02%20thiry.pdf#search=%22protein%20expression%20systems%20ppt%22
Przygotowanie do eksperymentu wybór protokołu klonowania/ekspresji rodzaj białka rozpuszczalność i stabilność białka miejsce produkcji białka (cytoplazma, pożywka) sposób oczyszczania białka
Etap I poszukiwanie informacji
Źródła informacji gdy sekwencja genu jest znana 1. Publikacje naukowe zawierają informacje o systemach ekspresyjnych użytych do ekspresji danego genu powinny zawierać odnośnik do sekwencji genu w postaci tzw. Accession No. dla wybranej bazy danych dostępnej w internecie np. NCBI (www.ncbi.nih.gov)
Źródła informacji gdy sekwencja genu jest znana 2. Bazy sekwencji nukleotydowych NCBI: National Centre for Biotechnology Information (Rockville Pike, Bethesda) Dostęp do sekwencji genów można uzyskiwać poprzez: podanie accession no. uzyskany z publikacji (Vonakis et al. J. Biol. Chem. 272 (38), 24072-24080 (1997)) Accession No: AF000301
Jak zdobyć informacje o genie jeśli sekwencja jego nie jest znana ale znana jest sekwencja białka lub jej fragmenty Sekwencję białka mozna poznać dysponując jego czystym preparatem dzięki ograniczonej proteolizie i sekwencjonowaniu uzyskanych peptydów
Jak zdobyć informacje o genie jeśli jego sekwencja nie jest znana W oparciu o sekwencje białka można zaprojektować zdegenerowane startery, które użyjemy w reakcji PCR i uzyskamy: Który prążek wybrać do sekwencjonowania??? Należy oprzeć się o przybliżenie: 1 kd białka 333 par zasad DNA i znaną masę białka (w kd)
Jak zdobyć informacje o genie jeśli sekwencja jego nie jest znana i nie jest znana sekwencja białka ale: Znamy właściwości fizykochemiczne białka, przede wszystkim jego Mw: W przypadku Prokariota możemy stworzyć bibliotekę DNA genomowego w celu uzyskania sekwencji W przypadku Eukariota możemy stworzyć bibliotekę DNA genomowego w celu uzyskania sekwencji
Jak zdobyć informacje o genie jeśli nie jest znana jego sekwencja, ani sekwencja kodowanego przez niego białka Wykorzystując dane uzyskane z bibliotek cdna możemy uzyskać sekwencję genów interesujących nas białek
Jak zdobyć informacje o genie, jeśli znamy tylko jego źródło? Istnieje możliwość zastosowania zasady genomiki porównawczej: Odnalezienie informacji o dostępności sekwencji analogicznych genów z najbliższych taksonomicznie krewnych Porównanie sekwencji nukleotydowych wybranych genów z organizmów pokrewnych do organizmu źródłowego
Programy komputerowe Gene doc
Programy komputerowe VectorNTI (INVITROGEN) Contig Express AlignX
AlignX (1) MfAJ252337 (1) McAY213657 (1) MeAJ252330 (1) rubrumaj270808 (1) Consensus (1) 1 10 20 30 40 50 60 70 80 -------------------------------ATCATTAACGCGCAAGAGGTCGAAGTTGGCCCCCGAAGCTCTTCCGTCTCCCCCC --------TCCGTAGGTGAACCTGCGGAAGGATCATTAACGCGCAAGAGGTCGAAGTTGGCCCCCGAAGCTCTTCCGTCTCCCCCC -------------------------------ATCATTAACGCGCAAGAGGTCGAAGTTGGCCCCCGAAGCTCTTCCGTCTCCCCCC ACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAACGCGCNGGCCG--GAGGCTGGCCCCCCACGAT---A----------- TCCGTAGGTGAACCTGCGGAAGGATCATTAACGCGCAAGAGGTCGAAGTTGGCCCCCGAAGCTCTTCCGTCTCCCCCC (255) 255 260 270 280 290 300 310 320 MfAJ252337(222) CGCTCGCCGGAGGATTACTCTGGAAAACACACTCTTGAAAGAACATACCGTCTGAGCG---AGCAACGCAAAT McAY213657(245) CGCTCGCCGGAGGATTACTCTGGAAAACACACTCTTGAAAGAACATACCGTCTGAGCG---AGCAACGCAAAT MeAJ252330(222) CGCTCGCCGGAGGATTACTCTGGAAAACACACTCTTGAAAGAACATACCGTCTGAGCG---AGCAACGCAAAT rubrumaj270808(219) CGCCCGCCGGAGGACAGACACCAAGAAAAAATTCTCTGAAGAGCTGTCAGTCTGAGCGTTTAGCAAGCACAAT Consensus(255) CGCTCGCCGGAGGATTACTCTGGAAAACACACTCTTGAAAGAACATACCGTCTGAGCG AGCAACGCAAAT