ADNOTACJE WARIANTÓW GENETYCZNYCH
WSTĘP 1. Adnotacja? 2. Klasyfikacja wariantów 3. Sequence Ontology terms 4. Variant Effect Predictor online skrypt 5. Inne źródła adnotacji
ADNOTACJA WARIANTÓW 1. Edycja danych 2. Przyrównanie 3. Post-alignment processing 4. Pre-variant calling processing 5. Detekcja wariantów polimorficznych 6. Adnotacja wariantów polimorficznych określenie znaczenia funkcjonalnego
Klasyfikacja wariantów
KLASYFIKACJA WARIANTÓW warianty w regionach intergenicznych warianty o destrukcyjnym wpływie na białka warianty w genach niekodujących białek powodują np. skrócenie łańcucha, utratę predykcja funkcji trudna funkcji, rozpad brak danych eksperymentalnych 23% high 52% modifier nie powodują zmiany funkcji białka znikomy wpływ na fenotyp 11% 14% moderate warianty lowo niedestrukcyjnym wpływie na białko mutacja może zmienić wydajność reakcji z udziałem białka Copyright 2017, 2015, Joanna Szyda
KLASYFIKACJA WARIANTÓW % SNP 100 80 BSW FLV 60 40 GUE HOL human 20 0 HIGH LOW MODERATE MODIFIER
KLASYFIKACJA WARIANTÓW % SNP 1.6 1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0 HIGH LOW MODERATE MODIFIER
Sequence ontology
SEQUENCE ONTOLOGY TERMS http://www.sequenceontology.org/
SEQUENCE ONTOLOGY TERMS Sequence Ontology Genome Biology 2005, 6:R44 (doi:10.1186/gb-2005-6-5-r44)
SEQUENCE ONTOLOGY TERMS http://www.ensembl.org/info/genome/variation/predicted_data. html#consequences
SEQUENCE ONTOLOGY TERMS http://www.ensembl.org/info/genome/variation/predicted_data. html#consequences
SEQUENCE ONTOLOGY TERMS http://www.ensembl.org/info/genome/variation/predicted_data. html#consequences
SEQUENCE ONTOLOGY TERMS Rasowo specyficzne SNP Brown Swiss wszystkie SO
SEQUENCE ONTOLOGY TERMS Rasowo specyficzne SNP Brown Swiss sekwencje kodujące
SEQUENCE ONTOLOGY TERMS Rasowo specyficzne SNP Guernsey wszystkie SO
SEQUENCE ONTOLOGY TERMS Rasowo specyficzne SNP Guernsey sekwencje kodujące
Variant effect predictor
VARIANT EFFECT PREDICTOR http://www.ensembl.org/info/docs/tools/vep/index.html
VARIANT EFFECT PREDICTOR http://www.ensembl.org/info/docs/tools/vep/index.html
VARIANT EFFECT PREDICTOR VEP online
VARIANT EFFECT PREDICTOR Input dla VEP SNP, indel https://www.ensembl.org/info/docs/tools/vep/vep_formats.html 1 124095095 124095095 A/C + 1 881907 881906 -/C + 4 98749350 98749350 G/C + 5 114215131 114215131 A/C - 7 22396117 22396117 A/C + 8 11958943 11958943 T/A + 8 110743501 110743501 A/G + 9 50568373 50568373 A/C - 12 65200544 65200544 A/C +
VARIANT EFFECT PREDICTOR Input dla VEP CNV 1 124095095 124095295 del 1 145351145 145353145 dup 4 98749350 98749850 del 5 114215131 114225131 del 7 22396117 22398117 dup 8 11958943 11959943 dup 8 110743501 110743901 del 9 50568373 50569373 del 12 65200544 65204544 del
VARIANT EFFECT PREDICTOR Wyniki online
VARIANT EFFECT PREDICTOR http://www.ensembl.org/info/docs/tools/vep/index.html
VARIANT EFFECT PREDICTOR VEP w linii komend./vep -i input.txt -o output.txt./vep -i $FILEIDN -o output.txt --species bos_taurus -- cache --no_progress
VARIANT EFFECT PREDICTOR http://www.ensembl.org/info/docs/tools/vep/script/vep_options. html
VARIANT EFFECT PREDICTOR Skrypt uruchomienia VEP #!/bin/bash ########################################### # snp annotation through vep and statistics ########################################### umask 006 # define variant calling software SOFT=FREEBAYES # define breed BREED=BSW # clean old files rm /mnt/diskstation/gene2farm/output/vepcounts.txt rm /mnt/diskstation/gene2farm/output/mr.txt # start analysis cd /mnt/diskstation/gene2farm/vcf/$soft/
VARIANT EFFECT PREDICTOR # start analysis cd /mnt/diskstation/gene2farm/vcf/$soft/ ls $BREED* > list.txt while read FILEID ; do Skrypt uruchomienia VEP echo "... gunzip for "$FILEID gunzip $FILEID echo "... vep for "$FILEIDN FILEIDN="${FILEID:0:23}" perl variant_effect_predictor.pl -i $FILEIDN -o output.txt --species bos_taurus --cache -- no_progress mv /mnt/diskstation/gene2farm/output/output.txt_summary.html $FILEIDN.html if [ $? -ne 0 ] ; then echo "perl program failed for "$FILEIDN ; fi echo "... gzip for "$FILEIDN gzip $FILEIDN echo "... sas for "$FILEIDN sas /mnt/diskstation/gene2farm/programs/vep1.sas if [ $? -ne 0 ] ; then echo "sas program failed for "$FILEIDN ; fi rm /mnt/diskstation/gene2farm/output/output.txt rm /mnt/diskstation/gene2farm/output/output.txt_warnings.txt done < /mnt/diskstation/gene2farm/vcf/$soft/list.txt echo "program finished"
VARIANT EFFECT PREDICTOR Wyniki w pliku tekstowym ## ENSEMBL VARIANT EFFECT PREDICTOR v80 ## Output produced at 2015-08-12 06:58:10 ## Connected to bos_taurus_core_80_31 on ensembldb.ensembl.org ## Using cache in /home/szyda/.vep/bos_taurus/80_umd3.1 ## Using API version 80, DB version 80 ## sift version sift5.2.2 ## genebuild version 2011-09 ## assembly version UMD3.1 ## dbsnp version 142 ## Extra column keys: ## IMPACT : Subjective impact classification ## DISTANCE : Shortest distance from variant to transcript ## STRAND : Strand of the feature (1/-1) #Uploaded_variation Location Allele Gene Feature Feature_type Consequence cdna_position CDS_position Protein_position Amino_acids Codons Existing_variation Extra 25_158_T/G 25:158 G ENSBTAG00000047565 ENSBTAT00000065458 Transcript upstream_gene_variant - - - - - - IMPACT=MODIFIER;DISTANCE=3689;STRAND=1 25_472_C/AC 25:472 AC ENSBTAG00000047565 ENSBTAT00000065458 Transcript upstream_gene_variant - - - - - - IMPACT=MODIFIER;DISTANCE=3375;STRAND=1
Inne źródła adnotacji
INNE ŹRÓDŁA INFORMACJI SIFT http://sift.jcvi.org/
INNE ŹRÓDŁA INFORMACJI PolyPhen http://genetics.bwh.harvard.edu/pph2/
INNE ŹRÓDŁA INFORMACJI Lista narzędzi https://omictools.com/variant-annotation-category
1. Adnotacja? 2. Klasyfikacja wariantów 3. Sequence Ontology terms 4. Variant Effect Predictor online skrypt 5. Inne źródła adnotacji