PODSTAWY BIOINFORMATYKI ORGANIZACJA ZAJĘĆ BIOINFORMATYKA PRZETWARZANIE I ANALIZA DANYCH

Podobne dokumenty
ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

Podstawy bioinformatyki - biologiczne bazy danych

BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH

CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1

PRACOWNIA INFORMATYCZNA CHARAKTERYSTYKA PRZEDMIOTU BASH - PODSTAWOWE INFORMACJE

BASH - WPROWADZENIE Bioinformatyka 4

PODSTAWY BIOINFORMATYKI

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ MAGDALENA FRĄSZCZAK

Kierunek Informatyka stosowana Studia stacjonarne Studia pierwszego stopnia

KARTA PRZEDMIOTU. (pieczęć wydziału)

Informatyka w medycynie Punkt widzenia kardiologa

Przewodnik do planowania programu kształcenia na II roku studiów I stopnia. Kierunek: Bioinformatyka. 17 czerwca 2013 r.

Przewodnik do planowania programu kształcenia na I roku studiów II stopnia. Kierunek: Bioinformatyka. 17 czerwca 2013 r.

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA

PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Projektowanie molekularne i bioinformatyka. 3-letnie studia I stopnia (licencjackie)

Wstęp do Informatyki dla bioinformatyków

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

Program studiów I st. (licencjackich) na kieruneku Biotechnologia

Wzorcowe efekty kształcenia dla kierunku studiów biotechnologia studia pierwszego stopnia profil ogólnoakademicki

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa

Jak Big Data rewolucjonizuje naukę oraz współpracę centrów badawczych z biznesem?

STATYSTYKA MATEMATYCZNA WYKŁAD 1

BIOLOGICZNE BAZY DANYCH SYLABUS

Kierunek: Inżynieria i Analiza Danych Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa i multimedia

STUDIA I STOPNIA NA KIERUNKU ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE. specjalność Biofizyka molekularna

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatics for Science. Tomasz Puton

Repetytorium z matematyki 3,0 1,0 3,0 3,0. Analiza matematyczna 1 4,0 2,0 4,0 2,0. Analiza matematyczna 2 6,0 2,0 6,0 2,0

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Biofizyka molekularna. 3-letnie studia I stopnia (licencjackie)

ZASADY PRZYZNAWANIA STYPENDIÓW ZA WYNIKI W NAUCE NA WYDZIALE BIOTECHNOLOGII UNIWERSYTETU WROCŁAWSKIEGO

PLGrid: informatyczne usługi i narzędzia wsparcia w nauce

"Zapisane w genach, czyli Python a tajemnice naszego genomu."

PLAN STUDIÓW. efekty kształcenia K6_U12 K6_W12 A Z O PG_ PODSTAWY BIOLOGII K6_W06 A Z K6_W01 K6_U01

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa i multimedia

Wprowadzenie do bioinformatyki

KARTA KURSU. Biotechnology in Environmental Protection. Kod Punktacja ECTS* 1

Program studiów I st. (licencjackich) na kieruneku Biotechnologia

Pierwsze kroki w świat biznesu

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Pracownia Informatyczna I ORGANIZACJA ZAJĘĆ, ZASADY ZALICZENIA

WSKAŹNIKI ILOŚCIOWE - Punkty ECTS w ramach zajęć: Efekty kształcenia. Wiedza Umiejętności Kompetencje społeczne (symbole) MK_1. Analiza matematyczna

P l a n s t u d i ó w

Programowanie obiektowe 2 - opis przedmiotu

Uniwersytet Przyrodniczy we Wrocławiu nie ponosi żadnych kosztów związanych z odbywaniem praktyk przez studentów.

Bioinformatyka Laboratorium, 30h. Michał Bereta

Program studiów magisterskich z Bioinformatyki i Biologii Systemów

P l a n s t u d i ó w

Bioinformatyka Laboratorium, 30h. Michał Bereta

Plan studiów na kierunku studiów wyższych: BIOCHEMIA studia pierwszego stopnia, profil ogólnoakademicki

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

Przewodnik dla instruktora dotyczący biotechnologii. (Plany lekcyjne) POZNAJ NAJNOWSZE INFORMACJE NA TEMAT BADAŃ NAD ZDROWIEM FINANSOWANIE: AUTORZY

Informatyka na UG... Witold Bołt

Techniki znakowania cząsteczek biologicznych - opis przedmiotu

Bioinformatyczna analiza danych. Wykład 1 Dr Wioleta Drobik-Czwarno Katedra Genetyki i Ogólnej Hodowli Zwierząt

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Projektowanie molekularne i bioinformatyka. 2-letnie studia II stopnia (magisterskie)

I. 1) NAZWA I ADRES: Uniwersytet Przyrodniczy we Wrocławiu, ul. C.K. Norwida 25/27, Wrocław, woj.

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Systemy operacyjne. Informatyka Stosowana, I rok. Krzysztof Wilk. Katedra Informatyki Stosowanej i Modelowania

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Wykład V. Rzut okiem na języki programowania. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Biofizyka molekularna. 2-letnie studia II stopnia (magisterskie)

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa, Inżynieria oprogramowania, Technologie internetowe

II. MODUŁY KSZTAŁCENIA

PLAN STUDIÓW PODYPLOMOWYCH: DIAGNOSTYKA MOLEKULARNA W ROKU 2019/2020. Nazwa modułu ECTS Semestr I Semestr II. Liczba godzin z.

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (1)

3. Podstawy genetyki S YLABUS MODUŁU (PRZEDMIOTU) I nformacje ogólne. Nazwa modułu. Kod F3/A. Podstawy genetyki. modułu

Plan studiów na kierunku studiów wyższych: BIOCHEMIA studia pierwszego stopnia, profil ogólnoakademicki

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2)

Kierunek: Elektronika i Telekomunikacja Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

Infrastruktura PLGrid

UNIWERSYTET ŁÓDZKI KIERUNEK CHEMIA - STUDIA STACJONARNE Specjalność nauczycielska w zakresie chemii i informatyki

Klaster obliczeniowy

SYLABUS. Wydział Biologiczno-Rolniczy. Katedra Biochemii i Biologii Komórki

PRZEDMIOTY DO WYBORU Lektorat z języka obcego Przedmioty dowolnego wyboru z całej oferty

Możliwości i potencjalne zastosowania Zintegrowanego Systemu Analitycznego do innowacyjnych i kompleksowych badań molekularnych

Wydział Informatyki WIT Studia inżynierskie (1. stopnia) niestacjonarne (zaoczne) Plan studiów w roku akademickim 2007/08 wg standardu ECTS 1 / 5

Kierunek: Elektronika i Telekomunikacja Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje w roku akademickim 2011/2012. Programowanie usług sieciowych

SYSTEMY OPERACYJNE SYLABUS A. Informacje ogólne

S YLABUS MODUŁU (PRZEDMIOTU) I nformacje ogólne. Stacjonarne (s)

Karta Opisu Przedmiotu

Techniki molekularne w biologii SYLABUS A. Informacje ogólne

Podstawy bioinformatyki sekwencjonowanie nowej generacji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing

Fizyka z elementami informatyki

INFORMATYKA PLAN STUDIÓW NIESTACJONARNYCH (W UKŁADZIE ROCZNYM) STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM

S YLABUS MODUŁU (PRZEDMIOTU) I nformacje ogólne. Nie dotyczy

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

BIOTECHNOLOGIA MEDYCZNA

Scenariusz lekcji biologii z wykorzystaniem metody CILIL Lekcja dla klasy IV technikum o rozszerzonym zakresie kształcenia

Efekty kształcenia dla kierunku Biotechnologia

Transkrypt:

PODSTAWY BIOINFORMATYKI ORGANIZACJA ZAJĘĆ BIOINFORMATYKA PRZETWARZANIE I ANALIZA DANYCH Magda Mielczarek Podstawy Bioinformatyki 1

Organizacja zajęć mgr Magda Mielczarek Katedra Genetyki, pokój nr 14 magda.mielczarek@up.wroc.pl magda.a.mielczarek@gmail.com tel: 71-320-57-51 Kontakt Slajdy Zadania theta.edu.pl KONSULTACJE Magda Mielczarek Podstawy Bioinformatyki 2

Organizacja zajęć 1. Organizacja zajęć; Bioinformatyka; Przetwarzanie i analiza danych 2. Biologiczne bazy danych 3. Przyrównanie sekwencji 4. Filogenetyka 5. Prezentacje artykułów naukowych. Dyskusja 6. Dane NGS; elementy programowania w różnych językach 7. Kolokwium (bez możliwości poprawy) Magda Mielczarek Podstawy Bioinformatyki 3

Zasady zaliczenia Obecność Kolokwium (praktyczne, z wykorzystaniem komputera) Prezentacja Listy zadań Aktywność Magda Mielczarek Podstawy Bioinformatyki 4

Polecane: Magda Mielczarek Podstawy Bioinformatyki 5

Czym jest bioinformatyka? Magda Mielczarek Podstawy Bioinformatyki 6

Bioinformatyka Bioinformatyka jest interdyscyplinarną dziedziną nauki obejmującą wykorzystanie metod obliczeniowych do badania danych biologicznych Higgs P., Attwood T., Bioinformatyka i ewolucja molekularna Bioinformatyka a biologia obliczeniowa Magda Mielczarek Podstawy Bioinformatyki 7

Bioinformatyka Interdyscyplinarność : biologia (molekularna) dane biologiczne, biotechnologiczne dane dotyczące kwasów nukleinowych, białek, lipidów, węglowodanów i innych makrocząsteczek Informatyka i matematyka - narzędzia, metody i obliczenia komputerowe nauki i techniki komputerowe, matematyka stosowana, statystyka, teoria prawdopodobieństwa Magda Mielczarek Podstawy Bioinformatyki 8

Cele bioinformatyki Organizacja i zarządzanie informacjami o danych biologicznych w formie skomputeryzowanych zapisów BAZY DANYCH Analiza danych tworzenie NARZĘDZI (programów, metod, algorytmów) systemy operacyjne (Unix, Linux) języki programowania (C, C++, PERL, Python, Ruby, JAVA, R, FORTRAN, itd.) Magda Mielczarek Podstawy Bioinformatyki 9

PRZYKŁAD ANALIZY ANALIZA GENOMOWYCH SEKWENCJI DNA - BIOINFORMATYCZNE ETAPY PRZETWARZANIA DANYCH NA KLASTRZE OBLICZENIOWYM Magda Mielczarek Podstawy Bioinformatyki 10

Zapis sekwencji DNA

Analiza genomowych sekwencji DNA Pozyskanie danych Bioinformatyczny ciąg analityczny Analiza wyników Magda Mielczarek Podstawy Bioinformatyki 12

Analiza genomowych sekwencji DNA Pozyskanie danych 2 670 139 648 zasad Bioinformatyczny ciąg analityczny 187 zwierząt 1 genom - do 73 GB (dane po kompresji) Analiza wyników 100 zasad

Analiza genomowych sekwencji DNA Pozyskanie danych Bioinformatyczny ciąg analityczny Kontrola jakości Przyrównanie do genomu referencyjnego Detekcja polimorfizmów genetycznych Analiza wyników Magda Mielczarek Podstawy Bioinformatyki 14

Analiza genomowych sekwencji DNA Pozyskanie danych Kontrola jakości Bioinformatyczny ciąg analityczny Analiza wyników Magda Mielczarek Podstawy Bioinformatyki 15

Analiza genomowych sekwencji DNA Pozyskanie danych Bioinformatyczny ciąg analityczny Przyrównanie do genomu referencyjnego ACTGGTGGGAA AAAGGGAACCT GGTGGGAAAAA GGGAACCTTTCT TGGGAAAAAATT GAACCTTTCTTT GAAAAAATTTCA CCTTTCTTTGGA GGGACTGATTCC AGAGAGATTTGC GACTGATTCCGA GAGAACCTTTCT Analiza wyników ACTGGTGGGGAAAAATTTCAAAAGGGAACCTTTCTTTGGAGCGGGACTGATTCCGAGAGAGA Genom referencyjny

Analiza genomowych sekwencji DNA Pozyskanie danych Bioinformatyczny ciąg analityczny Przyrównanie do genomu referencyjnego ACTGGTGGGAA AAAGGGAACCT GGTGGGAAAAA GGGAACCTTTCT TGGGAAAAAATT GAACCTTTCTTT GAAAAAATTTCA CCTTTCTTTGGA GGGACTGATTCC AGAGAGATTTGC GACTGATTCCGA GAGAACCTTTCT Analiza wyników ACTGGTGGGAA AAAGGGAACCT GGTGGGAAAAA GGGAACCTTTCC TGGGAAAAAATT GAACCTTTCCTT GGGACTACTGAT AGAGAGAT GAAAAAATTTCA CCTTTCCTTGGA GACTACTGATTC GAGA ACTGGTGGGGAAAAATTTCAAAAGGGAACCTTTCTTTGGAGCGGGACTGATTCCGAGAGAGA Genom referencyjny

Analiza genomowych sekwencji DNA Pozyskanie danych Detekcja polimorfizmów genetycznych Bioinformatyczny ciąg analityczny Analiza wyników SNP InDel ACTGGTGGGAA AAAGGGAACCT GGTGGGAAAAA GGGAACCTTTCC TGGGAAAAAATT GAACCTTTCCTT GGGACTTCTGAT AGAGAGAT GAAAAAATTTCA CCTTTCCTTGGA GACTTCTGATTC GAGA ACTGGTGGGGAAAAATTTCAAAAGGGAACCTTTCTTTGGAGCGGGACTGATTCCGAGAGAGA Genom referencyjny

liczba SNP Liczba SNP 7 000 000 6 000 000 5 000 000 4 000 000 3 000 000 2 000 000 min: 2 063 811 0.08% genomu max: 6 117 976 0.23% genomu sd: 663 223 1 000 000 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 Numer zwierzęcia Magda Mielczarek Podstawy Bioinformatyki 19

Analiza genomowych sekwencji DNA Pozyskanie danych Położenie polimorfizmu Polimorfizm synonimiczny? Bioinformatyczny ciąg analityczny Analiza wyników Przykład: 32 krowy zapalenie wymienia ACTGGTGGGAA ACTGATGGGAA Magda Mielczarek 20

Dlaczego superkomputer? przechowywanie danych surowe pliki po pliki po detekcji dane przyrównaniu polimorfizmów 6,1 TB 4,9 TB 44,8 GB + dane dodatkowe przetwarzanie danych przyrównanie; 8 rdzeni; 25 GB próba paralelizacja - przyspieszenie obliczeń ~ 19 GB max 24 rdzenie czas analiz dla wszystkich prób tygodnie? Magda Mielczarek Podstawy Bioinformatyki 21

Poznańskie Centrum Superkomputerowo- Sieciowe W praktyce przetwarzanie i przechowywanie danych biologicznych nie byłoby możliwe bez komputerów o dużej mocy obliczeniowej i o dużych zasobach pamięci dyskowej Magda Mielczarek Podstawy Bioinformatyki 22

InfoPlus - I. Makałowska Komputery w biologii molekularnej czyli bioinformatyka https://www.youtube.com/watch?v=istssvhazg8 Lista zadań http://theta.edu.pl/teaching/podstawy-bioinformatyki/ Magda Mielczarek Podstawy Bioinformatyki 23