CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1
PRACOWNIA INFORMATYCZNA PROWADZĄCY: Dr Magda Mielczarek (biolog) Katedra Genetyki, pokój nr 21 magda.mielczarek@upwr.edu.pl tel: 71-320-57-52 KONSULTACJE: Wtorek + czwartek (proszę o kontakt e-mailowy) PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 2
THETA.EDU.PL Teaching Kontakt SKN Bioinformatyków PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 3
# PROJEKT 1 Unravelling the Genetic Background of Clinical Mastitis in Cattle Using Whole Genome Sequence ANALIZA SEKWENCJI DNA CAŁEGO GENOMU Technologia NGS (Next Generation Sequencing) Sekwencje DNA całego genomu 32 krów: 16 osobników podatnych na zapalenie wymienia 16 osobników zdrowych PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 4
# PROJEKT 1 Unravelling the Genetic Background of Clinical Mastitis in Cattle Using Whole Genome Sequence ANALIZA SEKWENCJI DNA CAŁEGO GENOMU Detekcja polimorfizmów genetycznych: SNP CNV Znalezienie powiązania tymi pomiędzy polimorfizmami a zapaleniem wymienia PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 5
# PROJEKT 1 6000000 Liczba SNP w genomie 5000000 4000000 3000000 2000000 1000000 0 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 6
# PROJEKT 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 7
# PROJEKT 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 8
# PROJEKT 2 Impact of CNV on gene expression ANALIZA SEKWENCJI DNA CAŁEGO GENOMU Technologia NGS (Next Generation Sequencing) Sekwencje DNA i RNA 1 osobnika Duroc x Pietrain DNA-seq (genom) RNA-seq: (transkryptom), tkanki: tłuszcz, wątroba, miesień CELE Detekcja i funkcjonalna adnotacja CNV Kwantyfikacja ( zmierzenie ) ekspresji genów Zbadanie wpływu CNV na ekspresję PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK
# PROJEKT 2 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK
# PROJEKT 2 40 20 # deletions = 420 272 (65%) 148 (35%) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 X Y transcripts intergenic # duplications = 304 40 20 148 (49%) 156 (51%) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 X Y transcripts intergenic MAGDA MIELCZAREK
# PROJEKT 2 delecje min: 500 max: 133 700 średnia: 7 047 duplikacje min: 1 300 max: 520 000 średnia: 26 984 12
# PROJEKT 2 DELECJE GO - KEGG QTL - - DUPLIKACJE GO (+/-) sensory perception of smell (+) G-protein receptor (+) cellular metabolic processes (-) regulation of metabolic processes (-) KEGG (+) pathways of lipid metabolism class olfactory transduction inflammatory mediator regulation carcinogenesis QTL production traits and the meat quality skeletal system and bone structure immune system and others
ekspresja # PROJEKT 2 Wpływ wielkości delecji (% zajętego transkryptu) na ekspresję wątroba r=4.2654 10-5 p=0.4956 0 20 40 60 80 100 0 20 40 60 80 100 tłuszcz r=0.0001 p=0.4866 mięsień r=-0.002 p=0.6937 0 20 40 60 80 100 0 20 40 60 80 100 PRACOWNIA INFORMATYCZNA 2018/2019 0 20 40 60 80 100 % usuniętego transkryptu 0 20 14 40 MAGDA MIELCZAREK 60 80 100
ekspresja # PROJEKT 2 Wpływ wielkości duplikacji (% zajętego transkryptu) na ekspresję wątroba r=-0.0024 p=0.6894 0 20 40 60 80 100 0 20 40 60 80 100 tłuszcz r=0.0055 p=0.1296 mięsień r=0.0054 p=0.1347 0 20 40 60 80 100 0 20 40 60 80 100 PRACOWNIA INFORMATYCZNA 2018/2019 0 20 40 60 80 100 % zduplikowanego transkryptu 0 20 40 60 80 100 15 15 MAGDA MIELCZAREK
# PRZECHOWYWANIE I PRZETWARZANIE DANYCH 1 genom surowe dane pliki pośrednie pliki końcowe 8 TB 7 TB 50 GB + dane dodatkowe PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK
# PRZECHOWYWANIE I PRZETWARZANIE DANYCH przyrównanie; 8 rdzeni; 25 GB (genom) obliczenia równoległe- przyspieszenie obliczeń ~ 20 GB max 24 rdzenie czas analiz wszystkich genomów tygodnie? PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK
# DLACZEGO BASH? Praca na klastrach obliczeniowych Brak GUI W praktyce przetwarzanie i przechowywanie danych biologicznych nie byłoby możliwe bez komputerów o dużej mocy obliczeniowej i o dużych zasobach pamięci dyskowej Środowisko programistyczne Szybkie przetwarzanie danych Pisanie własnych skryptów Implementacja programów Wiele programów dostępnych jedynie pod Linuxa PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 18
# PRZECHOWYWANIE I PRZETWARZANIE DANYCH PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK
STUDENCI # DLACZEGO BASH? Bioinformatyka i inne nauki ścisłe! praca na klastrach obliczeniowych oferty pracy z fizyki i z chemii Informatyka środowisko programistyczne PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 20
PRACOWNIA INFORMATYCZNA # ORGANIZACJA ZAJĘĆ Pracownia: PRACA SAMODZIELNA (!) Na zajęciach W domu listy zadań mini wykłady PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 21
PRACOWNIA INFORMATYCZNA # ZASADY ZALECZENIA Obecność Zaliczenie: aktywność na zajęciach PRACA SAMODZIELNA (!) kolokwium napisanie prostego kodu i wyjaśnienie go nie ma możliwości korzystania z Internetu nie ma możliwości poprawy kolokwium PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 22
PRACOWNIA INFORMATYCZNA # TEMATYKA Biologiczne bazy danych Formaty danych Podstawowe narzędzia bash Przetwarzanie danych biologicznych Edytor tekstowy vim PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 23
PROJEKT: BIOLOGIA SYNTETYCZNA praca zespołowa praca samodzielna zespół będzie posiadał różne kompetencje (od biologii molekularnej, bioinformatyki, po design, marketing, itp...). uczestnicy z MIT, Harvard, ICL, itp. igem odbywa się w Bostonie, gdzie prezentuje się wyniki przeprowadzonych badań (j. angielski) PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 24