ADNOTACJE WARIANTÓW GENETYCZNYCH

Podobne dokumenty
BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE. Podstawy Bioinformatyki wykład 4

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE

PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE. Pracownia Informatyczna 2

Oprogramowanie dla GWAS

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

Pytania i odpowiedzi

1. KEGG 2. GO. 3. Klastry

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing. Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno

CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

PODSTAWY BIOINFORMATYKI 3 SEKWENCJONOWANIE GENOMÓW I

PAKIETY STATYSTYCZNE

POPULARNE POLECENIA SKRYPTY. Pracownia Informatyczna 2

WSTĘP Oprogramowanie dla GWAS

System operacyjny Linux

Choroba Niemanna-Picka, typ C

PRACOWNIA INFORMATYCZNA CHARAKTERYSTYKA PRZEDMIOTU BASH - PODSTAWOWE INFORMACJE

Choroba syropu klonowego

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ MAGDALENA FRĄSZCZAK

BASH - LINIA POLECEŃ. Bioinformatyka 2018/2019

PRACOWNIA INFORMATYCZNA BASH - PODSTAWOWE INFORMACJE

PODSTAWY BIOINFORMATYKI 11 BAZA DANYCH HAPMAP

Acrodermatitis enteropathica

Bazy danych i R/Bioconductor

Stwardnienie guzowate

Zespół krótkiego QT. Gen Choroba/objawy Sposób dziedziczenia. CACNA1C Zespół Brugadów, Zespół Timothy AD 15

Wrodzony przerost nadnerczy

Profilowanie somatyczne BRCA1, BRCA2

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

Searching for SNPs with cloud computing

Zespół hemolityczno-mocznicowy

Rak tarczycy - prognostyka

Zespół Alporta. Gen Choroba/objawy Sposób dziedziczenia. COL4A3 Zespół Alporta AD/AR 100. COL4A4 Zespół Alporta AD/AR 84. COL4A5 Zespół Alporta XL 583

Galaktozemia. Gen Choroba/objawy Sposób dziedziczenia GALE AR 12. GALK1 Niedobór galaktokinazy AR 14. GALT Galaktozemia AR 233

Przytarczyce, zaburzenia metabolizmu wapnia

Sekwencje akinezji płodu

Choroba Leśniowskiego i Crohna

STATYSTYKA MATEMATYCZNA WYKŁAD 1

Zespół Meckela. Gen Choroba/objawy Sposób dziedziczenia. B9D1 Meckel syndrome AR 5. B9D2 Meckel syndrome AR 5

PAKIETY STATYSTYCZNE

Rak płuc. Gen Choroba/objawy Sposób dziedziczenia. CDKN2A Czerniak, Rak trzustki, Rak płuca, Zespół predyspozycji do nowotworów AD 26

Hiperaldosteronizm rodzinny

Kwasica metylomalonowa

Porażenie okresowe. Gen Choroba/objawy Sposób dziedziczenia. CACNA1S Porażenie okresowe hipokaliemiczne, Hipertermia złośliwa AD 14

Zaburzenia czynności płytek krwi

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

Hemochromatoza. Gen Choroba/objawy Sposób dziedziczenia. HAMP Hemochromatosis AR 5. HFE Hemochromatosis, choroba Alzheimera, postać późna AR/Digenic 7

Moczówka prosta nerkowa

Ryzyko otyłości. Gen Choroba/objawy Sposób dziedziczenia. ADRB3 Otyłość MG 1. APOA2 Otyłość MG 0. FTO Otyłość MG 4. MC4R Otyłość MG 28

Administracja sieciowymi systemami operacyjnymi III Klasa - Linux

Zespół Robinowa. Gen Choroba/objawy Sposób dziedziczenia. DVL1 Zespół Robinowa AD 17. ROR2 Zespół Robinow, Brachydaktylia AD/AR 17

Zespół Marfana, zespół Bealsa

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2)

PAKIETY STATYSTYCZNE 5. SAS wprowadzenie - środowisko Windows

Zaburzenia metabolizmu kreatyny

Egzamin pisemny z przedmiotu: Systemy operacyjne Semestr I

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing

System operacyjny Linux wybrane zagadnienia. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Niedobór koenzymu q10

PODSTAWY BIOINFORMATYKI WYKŁAD 2 SEKWENCJONOWANIE GENOMÓW

1 Przygotował: mgr inż. Maciej Lasota

PODSTAWY BIOINFORMATYKI WYKŁAD 5 ANALIZA FILOGENETYCZNA

Modelowanie danych hodowlanych

Technologie Informacyjne - Linux 3

Przewlekła choroba ziarniniakowa

Tyrozynemia. Wszystkie typy tyrozynemii są dziedziczone w sposób autosomalny recesywny. Gen Choroba/objawy Sposób dziedziczenia. FAH Tyrozynemia AR 51

Niedobory czynników krzepnięcia

BASH - WPROWADZENIE Bioinformatyka 4

Hemochromatoza. Gen Choroba/objawy Sposób dziedziczenia. HAMP Hemochromatoza, Choroba Alzheimera, postać późna AR 2

Zgrubienie paznokci. Gen Choroba/objawy Sposób dziedziczenia. AAGAB Keratoderma, palmoplantar, punctate AD 6. GJB6 Deafness AR/Digenic 8

Arytmogenna kardiomiopatia prawej komory

Rak prostaty. Gen Choroba/objawy Sposób dziedziczenia. BRCA1 Rak piersi, Rak jajnika, Czerniak, Rak prostaty AD 1161

Zespół Ehlersa-Danlosa i choroby podobne

Hiperfenyloalaninemie

Choroba Parkinsona. Gen Choroba/objawy Sposób dziedziczenia. ATP13A2 Parkinson disease (Kufor-Rakeb syndrome) AR 11. DNAJC6 Juvenile Parkinsonism AR 2

Ataksja rdzeniowo-móżdżkowa

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

Wielotorbielowatość wątroby

Zespół Walkera-Warburga

Zespół Brugadów. Gen Choroba/objawy Sposób dziedziczenia. ANK2 Zaburzenia rytmu serca, Zespół długiego QT AD 7

Zapalenie trzustki. Częstość występowania dziedzicznego zapalenia trzustki szacuje się na 1 na osób. Gen Choroba/objawy Sposób dziedziczenia

Operatory zmiany sposobu przypisania standardowych strumieni >,<,>> Jeżeli pierwsze polecenie powiodło się to wykona drugie

Bioinformatyczne bazy danych - część 2. -przeszukiwanie baz danych -pobieranie danych

Przedwczesne wygasanie czynności jajników

Zespół Seckela. Gen Choroba/objawy Sposób dziedziczenia. ATR Teleangiektazje skórne i rodzinnie występujący rak (gardła), Zespół Seckela AD/AR 8

Ataksja rdzeniowo-móżdżkowa

Niedobór glikokortykosteroidów

Zespół Aicardiego-Goutièresa

GIST, paraganglioma, pheochromocytoma

Wrodzona stacjonarna ślepota nocna

Wrodzone włóknienie wątroby

PRZYGODY DGV. historia programu selekcji genomowej w Polsce. Joanna Szyda, Andrzej Żarnecki

Rak trzustki. Gen Choroba/objawy Sposób dziedziczenia. APC Rodzinna polipowatość gruczolakowata, Zespół Gardnera, Guzy desmoidalne AD 201

Krzywica hipofosfatemiczna

Zespół zaburzeń oddychania noworodka

Transkrypt:

ADNOTACJE WARIANTÓW GENETYCZNYCH

WSTĘP 1. Adnotacja? 2. Klasyfikacja wariantów 3. Sequence Ontology terms 4. Variant Effect Predictor online skrypt 5. Inne źródła adnotacji

ADNOTACJA WARIANTÓW 1. Edycja danych 2. Przyrównanie 3. Post-alignment processing 4. Pre-variant calling processing 5. Detekcja wariantów polimorficznych 6. Adnotacja wariantów polimorficznych określenie znaczenia funkcjonalnego

Klasyfikacja wariantów

KLASYFIKACJA WARIANTÓW warianty w regionach intergenicznych warianty o destrukcyjnym wpływie na białka warianty w genach niekodujących białek powodują np. skrócenie łańcucha, utratę predykcja funkcji trudna funkcji, rozpad brak danych eksperymentalnych 23% high 52% modifier nie powodują zmiany funkcji białka znikomy wpływ na fenotyp 11% 14% moderate warianty lowo niedestrukcyjnym wpływie na białko mutacja może zmienić wydajność reakcji z udziałem białka Copyright 2017, 2015, Joanna Szyda

KLASYFIKACJA WARIANTÓW % SNP 100 80 BSW FLV 60 40 GUE HOL human 20 0 HIGH LOW MODERATE MODIFIER

KLASYFIKACJA WARIANTÓW % SNP 1.6 1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0 HIGH LOW MODERATE MODIFIER

Sequence ontology

SEQUENCE ONTOLOGY TERMS http://www.sequenceontology.org/

SEQUENCE ONTOLOGY TERMS Sequence Ontology Genome Biology 2005, 6:R44 (doi:10.1186/gb-2005-6-5-r44)

SEQUENCE ONTOLOGY TERMS http://www.ensembl.org/info/genome/variation/predicted_data. html#consequences

SEQUENCE ONTOLOGY TERMS http://www.ensembl.org/info/genome/variation/predicted_data. html#consequences

SEQUENCE ONTOLOGY TERMS http://www.ensembl.org/info/genome/variation/predicted_data. html#consequences

SEQUENCE ONTOLOGY TERMS Rasowo specyficzne SNP Brown Swiss wszystkie SO

SEQUENCE ONTOLOGY TERMS Rasowo specyficzne SNP Brown Swiss sekwencje kodujące

SEQUENCE ONTOLOGY TERMS Rasowo specyficzne SNP Guernsey wszystkie SO

SEQUENCE ONTOLOGY TERMS Rasowo specyficzne SNP Guernsey sekwencje kodujące

Variant effect predictor

VARIANT EFFECT PREDICTOR http://www.ensembl.org/info/docs/tools/vep/index.html

VARIANT EFFECT PREDICTOR http://www.ensembl.org/info/docs/tools/vep/index.html

VARIANT EFFECT PREDICTOR VEP online

VARIANT EFFECT PREDICTOR Input dla VEP SNP, indel https://www.ensembl.org/info/docs/tools/vep/vep_formats.html 1 124095095 124095095 A/C + 1 881907 881906 -/C + 4 98749350 98749350 G/C + 5 114215131 114215131 A/C - 7 22396117 22396117 A/C + 8 11958943 11958943 T/A + 8 110743501 110743501 A/G + 9 50568373 50568373 A/C - 12 65200544 65200544 A/C +

VARIANT EFFECT PREDICTOR Input dla VEP CNV 1 124095095 124095295 del 1 145351145 145353145 dup 4 98749350 98749850 del 5 114215131 114225131 del 7 22396117 22398117 dup 8 11958943 11959943 dup 8 110743501 110743901 del 9 50568373 50569373 del 12 65200544 65204544 del

VARIANT EFFECT PREDICTOR Wyniki online

VARIANT EFFECT PREDICTOR http://www.ensembl.org/info/docs/tools/vep/index.html

VARIANT EFFECT PREDICTOR VEP w linii komend./vep -i input.txt -o output.txt./vep -i $FILEIDN -o output.txt --species bos_taurus -- cache --no_progress

VARIANT EFFECT PREDICTOR http://www.ensembl.org/info/docs/tools/vep/script/vep_options. html

VARIANT EFFECT PREDICTOR Skrypt uruchomienia VEP #!/bin/bash ########################################### # snp annotation through vep and statistics ########################################### umask 006 # define variant calling software SOFT=FREEBAYES # define breed BREED=BSW # clean old files rm /mnt/diskstation/gene2farm/output/vepcounts.txt rm /mnt/diskstation/gene2farm/output/mr.txt # start analysis cd /mnt/diskstation/gene2farm/vcf/$soft/

VARIANT EFFECT PREDICTOR # start analysis cd /mnt/diskstation/gene2farm/vcf/$soft/ ls $BREED* > list.txt while read FILEID ; do Skrypt uruchomienia VEP echo "... gunzip for "$FILEID gunzip $FILEID echo "... vep for "$FILEIDN FILEIDN="${FILEID:0:23}" perl variant_effect_predictor.pl -i $FILEIDN -o output.txt --species bos_taurus --cache -- no_progress mv /mnt/diskstation/gene2farm/output/output.txt_summary.html $FILEIDN.html if [ $? -ne 0 ] ; then echo "perl program failed for "$FILEIDN ; fi echo "... gzip for "$FILEIDN gzip $FILEIDN echo "... sas for "$FILEIDN sas /mnt/diskstation/gene2farm/programs/vep1.sas if [ $? -ne 0 ] ; then echo "sas program failed for "$FILEIDN ; fi rm /mnt/diskstation/gene2farm/output/output.txt rm /mnt/diskstation/gene2farm/output/output.txt_warnings.txt done < /mnt/diskstation/gene2farm/vcf/$soft/list.txt echo "program finished"

VARIANT EFFECT PREDICTOR Wyniki w pliku tekstowym ## ENSEMBL VARIANT EFFECT PREDICTOR v80 ## Output produced at 2015-08-12 06:58:10 ## Connected to bos_taurus_core_80_31 on ensembldb.ensembl.org ## Using cache in /home/szyda/.vep/bos_taurus/80_umd3.1 ## Using API version 80, DB version 80 ## sift version sift5.2.2 ## genebuild version 2011-09 ## assembly version UMD3.1 ## dbsnp version 142 ## Extra column keys: ## IMPACT : Subjective impact classification ## DISTANCE : Shortest distance from variant to transcript ## STRAND : Strand of the feature (1/-1) #Uploaded_variation Location Allele Gene Feature Feature_type Consequence cdna_position CDS_position Protein_position Amino_acids Codons Existing_variation Extra 25_158_T/G 25:158 G ENSBTAG00000047565 ENSBTAT00000065458 Transcript upstream_gene_variant - - - - - - IMPACT=MODIFIER;DISTANCE=3689;STRAND=1 25_472_C/AC 25:472 AC ENSBTAG00000047565 ENSBTAT00000065458 Transcript upstream_gene_variant - - - - - - IMPACT=MODIFIER;DISTANCE=3375;STRAND=1

Inne źródła adnotacji

INNE ŹRÓDŁA INFORMACJI SIFT http://sift.jcvi.org/

INNE ŹRÓDŁA INFORMACJI PolyPhen http://genetics.bwh.harvard.edu/pph2/

INNE ŹRÓDŁA INFORMACJI Lista narzędzi https://omictools.com/variant-annotation-category

1. Adnotacja? 2. Klasyfikacja wariantów 3. Sequence Ontology terms 4. Variant Effect Predictor online skrypt 5. Inne źródła adnotacji