DIAGNOSTYKA MOLEKULARNA CHORÓB DZIEDZICZNYCH - METODY I INTERPRETACJA WYNIKÓW BADAŃ Monika Gos Zakład Genetyki Medycznej Instytut Matki i Dziecka, Warszawa Patologia molekularna wybranych chorób genetycznie uwarunkowanych, IBB, 14.11.2016
Online Mendelian Inheritance in Man (OMIM) Class of phenotype Phenotype Gene Single gene disorders and traits Susceptibility to complex disease or infection 4,836 3,266 701 500 "Nondiseases" 142 112 Somatic cell genetic disease 205 117 Przykład: wrodzone wady metabolizmu - choroby monogenowe ok. 400 jednostek chorobowych
Mutacje aberracje chromosomowe - liczbowe (poliploidia, aneuploidia) - strukturalne (translokacje, inwersje, delecje, izochromosomy, duplikacje, chromosomy pierścieniowe, dicentryczne) - inne np. chromosomy markerowe mutacje punktowe mutacje dynamiczne (powtórzenia sekwencji nukleotydowych)
Badania molekularne co badamy? 5 UTR 3 UTR EKSON EKSON INTRON EKSON INTRON EKSON zmiany w obrębie sekwencji kodujących lub na styku intron/ekson zmiany punktowe substytucje, delecje, insercje delecje/duplikacje pojedynczych eksonów
Mutacje punktowe GGG GAG AAC TAC... G E N Y Gly Glu Asn Tyr... missens GGG GAG TAC TAC... G E Y Y Gly Glu Tyr Tyr... nonsens GGG GAG AAC TAG... G E N * Gly Glu Asn STOP duplikacja/insercja GGG GGA GAA CTA C.. G G E L Gly Gly Glu Leu... delecja GGG AGA ACT ACG... G R T T Gly Arg Thr Thr...
Wraz z rozwojem technik molekularnych rozszerza się zakres analizy DNA mutacja gen genom W większości przypadków stosowane techniki wykorzystują zdolność DNA do tworzenia kompleksów z sekwencjami komplementarnymi.
Techniki wykorzystywane w analizie molekularnej PCR HYBRYDYZACJA PCR (2 n kopii danego fragmentu)
PCR-RFLP i ASA-PCR PCR-restriction fragment length polymorphism analiza długości fragmentów restrykcyjnych (ACRS-PCR) Allele-specific amplification amplifikacja specyficzna dla allelu PCR-RFLP NT hom1 het hom2 T A T G amplifikacja brak amplifikacji AA AG GG Program: webcutter C A C G brak amplifikacji amplifikacja AA AG GG
Testy przesiewowe SSCP Single Strand Conformation Polymorphism HD HeteroDuplex analysis DGGE - Denaturing Gradient Gel Electrophoresis TGGE -Temperature Gradient Gel Electrophoresis DHPLC - Denaturing High Performance Liquid Chromatography HRM High Resolution Melting analysis analiza znanych mutacji przesiew sekwencjonowanie
Analiza fragmentów DNA (PCR, QF-PCR) PCR ze starterami fluorescencyjnymi (również multiplex) Sekwenator (ABI Prism), wzorzec wielkości (ROX, LIZ) Analiza: GeneMapper, GeneMarker, etc. 20 29 M 1 2 3 4 5 6 7 8 9 45* K m p/- x
Testy oparte o metodę hybrydyzacji INNO-LiPA (Fujirebio) testy do analizy mutacji w genie CFTR
Testy oparte o metodę hybrydyzacji Metoda Real-Time PCR (sondy allelospecyficzne)
Technika sekwencjonowania metodą Sangera sekwencjonowanie pierwszej generacji odczyt sekwencji nukleotydowej wybranego pojedynczego fragmentu DNA matryca: produkt reakcji PCR HRAS - c.34g>a, p.gly12ser
HGVS Human Genome Variation Society 1. należy używać nazw genów zgodnych z HGNC (np. nie MLL2, tylko KMT2D) 2. wszystkie opisywane zmiany muszą być opisane na poziomie DNA 3. zawsze w opisie mutacji należy podać literę opisującą sekwencję referencyjną: > kodujący DNA c.35a>g > sekwencja genomowa g.375c>t > sekwencja mitochondrialna m.8993t>c > sekwencja RNA r.67c>g > sekwencja aminokwasowa p.arg408trp > niekodujący RNA n. 4. w opisie zmiany powinien być podany numer sekwencji referencyjnej. LRG - Locus Reference Genomic dopuszcza się użycie sekwencji NCBI, pod warunkiem podania wersji sekwencji np. LDLR - NM_000527.4 5. sekwencja referencyjna nukleotydowa główny i najdłuższy transkrypt 6. sekwencja referencyjna białkowa pierwotny produkt translacji 7. DNA duże litery, RNA małe litery, białko kod trójliterowy, pierwsza litera duża
HGVS Human Genome Variation Society g. c. p.
HGVS Human Genome Variation Society Opis zmian substytucja c.34a>t zakres zmiany c.34_38delatgca delecja c.34dela duplikacja c.34dupa insercje c.34_35insg ALE: c.35dupt, a nie c.35_36inst inwersja c.34_76inv konwersja c.123_678connm_004006.1:c.123_678 allel [ ] w przypadku sekwencji powtórzonych zakładamy, że zmianie uległ nukleotyd/-y znajdujące się na końcu 3 sekwencji. delecje/duplikacje kilku eksonów: c.(780+1_781-1)_(1392+1_1393-1)del/dup c.(423+1_424-1)_(*763_?)del/dup c.(?_-79)_(*763_?)del
Zapis mutacji zgodny z HGVS NM_000277.1: c.1222c>t NP_000268.1: p.arg408trp Zapis genotypu zgodny z HGVS NM_000277.1: c.[=];[=] NM_000277.1: c.[1222c>t];[=] NM_000277.1: c.[1222c>t];[1222c>t] NM_000277.1: c.[1222c>t];[(1222c>t)]
MRC Holland MLPA identyfikacja delecji / duplikacji w wybranych regionach chromosomowych w wybranych zestawach sondy specyficzne dla najczęstszych mutacji możliwość analizy metylacji w wybranych regionach chromosomowych analiza z wykorzystaniem oprogramowania komercyjnego (np. GeneMarker, Softgenetics) lub dostarczanego przez MRC-Holland (Coffalyser.Net)
Sekwencjonowanie następnej generacji (NGS) wysokoprzepustowe sekwencjonowanie równoległe ang. massive parallel sequencing sekwencjonowanie genomu (WGS, WES, TES) DNA-Seq sekwencjonowanie transkryptomu RNA-Seq sekwencjonowanie epigenomu Epi-Seq sekwencjonowanie mikrobiomu badanie oddziaływań DNA z białkami ChiP-seq sekwencjonowanie genomów de novo EKSOM KLINICZNY MENDELIOME, CLINOME
Genom Metoda Koszt Human Genome Project (13 lat) Sekwenator kapilarny 2,7 mld $ Venter Genome (9 miesięcy) Sekwenator kapilarny (>340tys. reakcji) 70 mln $ James Watson Roche, 454 (234 reakcje) 1 mln $ James Lupski Life/APG (3 reakcje) 75 tys. $
Sekwencjonowanie drugiej generacji 1. fragmentacja DNA + ligacja adaptorów specyficznych dla sekwenatora sonikacja, trawienie enzymami (np. Nextera), nebulizacja wzbogacanie 2. amplifikacja biblioteki na stałym nośniku (kulce magnetycznej lub płytce) 3. właściwa reakcja sekwencjonowania - jednoczesne sekwencjonowanie wielu fragmentów DNA (sekwencje są krótsze niż w przypadku klasycznego sekwencjonowania kapilarnego (wyjątek: PacBio); odczyt pojedynczej nici DNA, co umożliwia analizę jakościową (w chwili obecnej również ilościową) 4. analiza bioinformatyczna dopasowanie odczytów do sekwencji referencyjnej, anotacja (analiza zmian)
DNA jako matryca do sekwencjonowania DNA dwuniciowe, nie zdegradowane (żel) odpowiednio przechowywane (np. nierozmrażane wielokrotnie, odpowiednie ph i temperatura) OD260/OD280 1,8-2,0 OD260/OD230 ~ 2,0 brak wytrąconych kryształów lub resztek kulek magnetycznych bez domieszki RNA bez domieszki odczynników wykorzystywanych do izolacji DNA (sole guanidynowe, fenol, SDS) brak zanieczyszczeń biologicznych (np. hemu, bakterii wymazówki 30% DNA z bakterii) pomiar ilości i jakości DNA Nanodrop vs. Qubit/Quantus QC-PCR AMEL-XY/GAPDH
Fragmentacja DNA Fragmentacja mechaniczna Fragmentacja enzymatyczna Enzymy restrykcyjne (Haloplex) Nextera (Illumina, NimbleGen) Covaris M220 Naprawa końców Adenylacja na końcu 3 Ligacja adaptorów SureSelect, NimbleGen Ion Xpress Plus Fragment Library Kit Ion Shear enzymatic shearing method
Wzbogacanie bibliotek hybrydyzacja amplifikacja SureSelect i Haloplex (Agilent) Nextera Rapid Capture Kits i TruSight Kits (Illumina) SeqCap EZ Exome i Choice (NimbleGen) Panele własne (NimbleDesign, Agilent SureDesign, DesignStudio) Panele komercyjne - Multiplicom (CFTR, BRCA) - TruSight Tumor (Illumina) - Ion AmpliSeq Panele własne (NexteraXT) i projekty z wykorzystaniem programów producentów (Ion AmpliSeq Designer) Sondy DNA lub RNA, biotynylowane
Amplifikacja biblioteki Emulsyjny PCR Ion OneTouch TM 2 System Amplifikacja mostkowa (na płytce) Źródło: Metzker ML, Nature Review Genetics
Sekwencjonowanie Sekwencjonowanie przez syntezę z wykorzystaniem barwników fluorescencyjnych Sekwencjonowanie przez syntezę z wykorzystaniem technologii półprzewodnikowej Pokrycie (coverage): im wyższe, tym mniejsza szansa na błąd Źródło: Illumina, LifeTechnologies,
Analiza bioinformatyczna pliki *.bcl plik *.fastq (CASAVA) dopasowanie wygenerowanych przez sekwenator sekwencji do genomu referencyjnego (hg19) plik *.bam (BWA) analiza sekwencji pod kątem obecności zmian podstawień pojedynczych nukleotydów lub insercji / delecji + anotacja plik *.vcf (m.in. GATK, SAMTools) analiza funkcjonalna odniesienie do populacyjnych baz danych (1000Genomes, EVS/NHLBI, ExAC, ClinVar), analiza predykcyjna plik Excel (*.tsv, *.txt, *.csv) wybór wariantu związanego z patogenezą choroby
Integrative Genomic Viewer (IGV)
Bazy danych przydatne w analizie NGS bazy populacyjne: in-house, 1000Genomes, NHLBI, ExAC http://www.1000genomes.org/1000-genomes-browsers http://evs.gs.washington.edu/evs/ http://exac.broadinstitute.org/
Bazy danych przydatne w analizie NGS bazy danych OMIM - http://www.omim.org/ HGMD - http://www.hgmd.cf.ac.uk/ac/index.php LOVD - http://www.lovd.nl/3.0/home ClinVar - http://www.ncbi.nlm.nih.gov/clinvar/ UCSC - https://genome.ucsc.edu/ Phenomizer - http://compbio.charite.de/phenomizer/ programy do analizy in silico predykcyjne, nie zastąpią analizy kosegregacji i analiz funkcjonalnych (Google SIFT, Provean, Polyphen, Mutationtaster, etc.)
Eurogentest guidelines for NGS
Eksom Clinome Panel porównanie Parametr Eksom Clinome Celowane NGS koszt ++ ++ + pokrycie + ++ +++ wpływ wzbogacania sekwencji praca w laboratorium + + + 1 biblioteka/ wiele chorób 1 biblioteka/ wiele chorób 1 biblioteka/ 1 lub kilka chorób Ilość danych +++ ++ + CNV +/- +/- +/- nowe geny? + - -
Zalecenia EuroGenTest 5. Pathogenic 4. Likely pathogenic 3. Unknown significance (UV, VUS) 2. Likely benign 1. Benign