Ćwiczenie 4 Oznaczenie polimorfizmu genetycznego cytochromu CYP2D6: wykrywanie liczby kopii genu Wstęp CYP2D6 kodowany przez gen występujący w co najmniej w 78 allelicznych formach związanych ze zmniejszoną aktywnością lub brakiem aktywności enzymatycznej, przy czym w populacjach kaukaskich główną przyczyną niedoboru aktywności CYP2D6 jest obecność alleli *3 (SNPframeshift), *4 (SNP-splicing defect) i *5 (delecja genu). Wśród osób rasy kaukaskiej około 1-7% ma wiele aktywnych kopii genu, odpowiedzialnych za znacznie zwiększoną, ultraszybką aktywność metaboliczną. Osoby wolno oraz ultraszybko metabolizujące różnią się 5-15 krotnie szybkością metabolizmu od osób homozygotycznych z dwoma allelami dzikimi. Zmienność genetyczna ludzkiego genomu może wynikać z różnic na poziomie pojedynczych nukleotydów (SNP) aż po aberracje chromosomowe (strukturalne, liczbowe). Badania oparte na technologii mikromacierzy pozwoliły na wykrycie różnorodnych i istotnych zmian genomu. Ok. 12% ludzkiego genomu wykazuje zmienność wynikającą z duplikacji, delecji lub innych kombinacji określanych jako zmiana liczby kopii CNV (ang. Copy Number Variation) (Rys. 1). CNV mogą mieć wpływ na poziom ekspresji genów, różnice fenotypowe a w konsekwencji choroby (zespoły mikrodelecji, mikroduplikacji). Rys. 1 Zmiany strukturalne DNA ( źródło: Estivill et al. [2007]PloS Genet October: 3[10]:e190) Dobrym narzędziem do określenia liczby kopii genu w badaj próbie DNA jest PCR w czasie rzeczywistym (QPCR). Analiza wykonywana jest w identyczny sposób, jak badanie ekspresji genów, z tym, że matrycą w reakcji nie jest cdna, a genomowe DNA pacjenta. Wszystkie odmiany PCR w czasie rzeczywistym, niezależnie od metody detekcji, opierają się na tej samej zasadzie pomiaru przyrostu amplifikowanej matrycy. Po każdym cyklu PCR mierzony jest względny poziom fluorescencji (R) w określonym zakresie widma, odpowiadającym wybranemu fluorochromowi. W przypadku CYP2D6 analiza CNV pozwala na określenie występowania 1) delecji genu tzw. allela *5 oraz 2) duplikacji (*1x2) i multiplikacji genu (*1xn). 1
W analizie CNV przeprowadzane są równolegle w jednej próbie 2 reakcje PCR w czasie rzeczywistym - badanego genu oraz genu o znanej, stałej ilości kopii w genomie (gen referencyjny) Jest to więc tzw. multiplex PCR. Mieszanina reakcyjna składa się z: polimerazy, dntps, buforu swoistego dla polimerazy, barwnika referencyjnego ROX (barwnik reporterowy używany w celu normalizacji sygnału fluorescencyjnego - w przypadku stosowania aparatów AB), para starterów dla genu badanego oraz sonda TaqMan znakowana fluorochromem (np. FAM) para starterów dla genu referencyjnego, który w ludzkich komórkach diploidalnych zawsze występuje w liczbie 2 kopii (np. RNasa P) oraz sonda TaqMan znakowana innym fluorochromem (np. VIC) Rys. 2 PCR i detekcja genu badanego i genu referencyjnego w jednej próbie 2
Od zmierzonej wartości R odejmowany jest poziom tła, będącym średnim poziomem fluorescencji w początkowej fazie PCR (np. 3-15 cykl). Uzyskane w ten sposób wartości względnego wzrostu fluorescencji po każdym z cykli PCR ( Rn), proporcjonalne do ilości powstającego produktu PCR, nanoszone są na wykres. W przypadku prawidłowo wykonanej reakcji wykresy przedstawiają równoległe krzywe sigmoidalne o identycznym nachyleniu. Następnie program arbitralnie ustala linię progową (ang. threshold line), umieszczoną powyżej nieswoistych odchyleń Rn. Dla każdej z badanych próbek oznaczana jest C T (ang. cycle threshold) po których krzywa amplifikacji przecina linię progową. Im większa początkowa ilość matrycy, tym mniejsza wartość C T - tym szybciej fluorescencja osiąga wartość progową (Rys.3). Rys.3 Krzywa amplifikacji dwóch prób A i B. Próba A zawiera znacznie więcej kopii badanej sekwencji wartość CT dla tej próby, odczytana z osi x, jest znacznie mniejsza. Następnym etapem jest określenie różnicy wartości różnicy C T dla genu badanego i genu referencyjnego w próbie badanej oraz analizowanej równolegle próbie kalibracyjnej próbie DNA o znanej ilości kopii genu badanego. C T (próba badana) = C T (gen badany w próbie badanej) - C T (gen referencyjny w próbie badanej) C T (próba kalibracyjna) = C T (gen badany w próbie kalibracyjnej) - C T (gen referencyjny w próbie kalibracyjnej) Uzyskane różnice ( C T ) dla próby badanej porównuje się z wartością C T uzyskaną dla próby kalibracyjnej (jednej z analizowanych prób, stanowiącej próbę odniesienia o znanej ilości kopii genu badanego): C T = C T (próba badana) - C T (próba kalibracyjna) 3
Metoda opiera się na założeniu, że w fazie logarytmicznej PCR w każdym cyklu liczba kopi amplikonu zwiększa się dwukrotnie (100% wydajność reakcji). Stąd: Względna liczba kopii genu (względna liczba kopii danej sekwencji w porównaniu do próby kalibracyjnej): RQ = 2 - CT liczba kopii genu = RQ n (n - liczba kopii genu ref. - zwykle dwie kopie) Jeśli C T = 0 oznacza to, że względna liczba kopii badanego genu w próbie badanej jest taka sama jak w kalibracyjnej (2 0 =1) Jeśli C T = około -0,6 oznacza to, że względna liczba kopii badanego genu w próbie badanej jest półtora razy większa niż w kalibracyjnej 3 kopie genu, duplikacja jednego allela (2 -(-0,6) =1,5) Jeśli C T = -1 oznacza to, że względna liczba kopii badanego genu w próbie badanej jest dwa razy większa niż w kalibracyjnej 4 kopie genu (2 -(-1) =2) Jeśli C T = 1 oznacza to, że względna liczba kopii badanego genu w próbie badanej jest dwa razy mniejsza niż w kalibracyjnej (delecja jednego z alleli) (2-1 =0,5) Jeśli C T = -2 oznacza to, że względna liczba kopii badanego genu w próbie badanej jest cztery razy większa niż w kalibracyjnej (2 -(-2) =4) Uwaga: Nie zawsze wydajność reakcji jest stuprocentowa. Wpływają na nią m.in. swoistość amplifikacji i sond, obecność inhibitorów (np. z procesu izolacji DNA), a także jakość stosowanych odczynników, szczególnie polimerazy. Np. Jeśli wydajność wynosi 70% to ilość kopii amplifikowanej sekwencji w każdym cyklu zwiększa się 1.7 x a nie 2 x, wówczas RQ = 1,7 - CT *n Wydajność można wyznaczyć przez sporządzenie krzywej standardowej przygotowanie PCR z użyciem jako matrycy seryjnych rozcieńczeń jednej z prób. (Kiedy rozcieńczymy dwukrotnie próbę wiemy, że jest tam dwa razy mniej kopii badanego genu: jeśli różnica wartości Ct pomiędzy tymi rozcieńczeniami wyniesie 1, oznacza to 100% wydajność reakcji, a różnica większa oznacza obniżoną wydajność reakcji potrzeba więcej niż jednego cyklu PCR, aby zwiększyć liczbę kopii dwukrotnie. próba badana próba, w której chcemy oznaczyć liczbę kopii; próba kalibracyjna wzorcowa, o znanej, wcześniej określonej liczbie kopii genu badanego; gen badany - np. CYP2D6, gen, którego liczbę kopii ustalamy; gen referencyjny taki, który zawsze występuje w tej samej liczbie kopii w każdej próbie DNA; 4
Określanie genotypu CYP2D6 na podstawie badań pod kątem obecności alleli *3 i *4 oraz liczby kopii genu (wg przyjętej nomenklatury - *5 delecja, *1x2 duplikacja, *1x3 - tryplikacja) Każda próba zwiera 2 allele genu (ojcowski i matczyny). Aktywność enzymu pacjenta determinuje liczba kopii prawidłowych sekwencji genu na obu chromosomach (czyli kodujących aktywne białko). Dwie kopie aktywne to wydajny metabolizm substratów. Tabela przedstawia interpretację badania na podstawie złożenia wyników poszczególnych badań. Tabela zawiera jedynie najczęstsze kombinacje w populacji polskiej. liczba alleli *3 liczba alleli *4 liczba kopii genu genotyp fenotyp 0 0 2 *1/*1 EM 1 0 2 *1/*3 IM 0 1 2 *1/*4 IM 1 1 2 *3/*4 PM 0 2 2 *4/*4 PM 0 0 1 *1/*5 IM 0 1 1 *4/*5 PM 0 0 3 *1/*1x2 UM 0 1 3 *4/*1x2 EM 0 0 0 *5/*5 PM EM wydajny (szybki) metabolizm; IM pośredni metabolizm; PM wolny metabolizm; UM ultraszybki metabolizm 5