BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH

Podobne dokumenty
Podstawy bioinformatyki - biologiczne bazy danych

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (1)

PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2)

ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

PODSTAWY BIOINFORMATYKI ORGANIZACJA ZAJĘĆ BIOINFORMATYKA PRZETWARZANIE I ANALIZA DANYCH

Bioinformatyczne bazy danych

Bioinformatyczne bazy danych

Kierunek Informatyka stosowana Studia stacjonarne Studia pierwszego stopnia

BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE. Pracownia Informatyczna 2

BIOLOGICZNE BAZY DANYCH SYLABUS

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Bioinformatyka Laboratorium, 30h. Michał Bereta

Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Bioinformatyczne bazy danych

CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

Wzorcowe efekty kształcenia dla kierunku studiów biotechnologia studia pierwszego stopnia profil ogólnoakademicki

Bioinformatyka Laboratorium, 30h. Michał Bereta

PODSTAWY BIOINFORMATYKI

Księgarnia PWN: A.D. Baxevanis, B.F.F. Ouellette Bioinformatyka

Wprowadzenie do bioinformatyki

"Zapisane w genach, czyli Python a tajemnice naszego genomu."

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Projektowanie molekularne i bioinformatyka. 3-letnie studia I stopnia (licencjackie)

Bioinformatyka. Michał Bereta

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

KARTA PRZEDMIOTU. (pieczęć wydziału)

Field of study: Computer Science Study level: First-cycle studies Form and type of study: Full-time studies. Auditorium classes.

Bioinformatyczne bazy danych - część 2. -przeszukiwanie baz danych -pobieranie danych

Pierwsze kroki w świat biznesu

Bioinformatyka. Bazy danych. Wykład 3. E. Banachowicz. Wykład monograficzny Bioinformatyka. Wykład 3, Zakład Biofizyki Molekularnej IF UAM

Informatyka w medycynie Punkt widzenia kardiologa

Przewodnik do planowania programu kształcenia na II roku studiów I stopnia. Kierunek: Bioinformatyka. 17 czerwca 2013 r.

Bioinformatyka. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta

BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE. Podstawy Bioinformatyki wykład 4

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

Programowanie. programowania. Klasa 3 Lekcja 9 PASCAL & C++

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa i multimedia

Informatyka wspomaga przedmioty ścisłe w szkole

STUDIA I STOPNIA NA KIERUNKU ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE. specjalność Biofizyka molekularna

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Biofizyka molekularna. 3-letnie studia I stopnia (licencjackie)

Ćwiczenie 5/6. Informacja genetyczna i geny u różnych grup organizmów. Porównywanie sekwencji nukleotydowych w bazie NCBI z wykorzystaniem BLAST.

BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE

Wstęp do Informatyki dla bioinformatyków

Wykład V. Rzut okiem na języki programowania. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

KIERUNKOWE EFEKTY KSZTAŁCENIA

Biologiczne bazy i modele danych

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA

KARTA OPISU MODUŁU KSZTAŁCENIA

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ MAGDALENA FRĄSZCZAK

Opis zakładanych efektów kształcenia OPIS ZAKŁADANYCH EFEKTÓW KSZTAŁCENIA

Samouczek: Konstruujemy drzewo

Informatyka na UG... Witold Bołt

EFEKTY KSZTAŁCENIA DLA KIERUNKU STUDIÓW BIOINFORMATYKA

PRACOWNIA INFORMATYCZNA CHARAKTERYSTYKA PRZEDMIOTU BASH - PODSTAWOWE INFORMACJE

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Biofizyka molekularna. 2-letnie studia II stopnia (magisterskie)

PLAN STUDIÓW. efekty kształcenia K6_U12 K6_W12 A Z O PG_ PODSTAWY BIOLOGII K6_W06 A Z K6_W01 K6_U01

Nowa podstawa programowa przedmiotu informatyka w szkole ponadpodstawowej

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Projektowanie molekularne i bioinformatyka. 2-letnie studia II stopnia (magisterskie)

Bazy i modele danych

1

Kontakt.

BIOINFORMATYKA. Copyright 2011, Joanna Szyda

INFORMATYKA POZIOM ROZSZERZONY

INFORMATYKA POZIOM ROZSZERZONY

Wymagania edukacyjne na ocenę z informatyki KLASA III

Dopasowanie sekwencji (sequence alignment)

TOK STUDIÓW Kierunek: informatyka rok studiów: I studia stacjonarne pierwszego stopnia, rok akademicki 2014/2015. Forma zaliczen ia. egz. lab.

PLAN STUDIÓW. Rodzaj zajęć. e-nauczanie,

3. DZIEDZINY NAUKI I DYSCYPLINY, DO KTÓRYCH ODNOSZĄ SIĘ KIERUNKOWE EFEKTY KSZTAŁCENIA:

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa

CZĘŚĆ III OPISPRZEDMIOTU ZAMÓWIENIA (OPZ)

BIOTECHNOLOGIA MEDYCZNA

Ewolucja molekularna człowieka okiem bioinformatyka. Justyna Wojtczak Jarosław Jeleniewicz

Podstawy Programowania Algorytmy i programowanie

Database resources of the National Center for Biotechnology Information. Magdalena Malczyk

na podstawie artykułu: Modeling Complex RNA Tertiary Folds with Rosetta Clarence Yu Cheng, Fang-Chieh Chou, Rhiju Das

BASH - WPROWADZENIE Bioinformatyka 4

Księgarnia PWN: Paul G. Higgs, Teresa K. Attwood - Bioinformatyka i ewolucja molekularna

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

Przewodnik do planowania programu kształcenia na I roku studiów II stopnia. Kierunek: Bioinformatyka. 17 czerwca 2013 r.

Bioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee

INFORMATYKA, TECHNOLOGIA INFORMACYJNA ORAZ INFORMATYKA W LOGISTYCE

Wymagania - informatyka

Program studiów magisterskich z Bioinformatyki i Biologii Systemów

Kierunek: Inżynieria i Analiza Danych Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

Motywacja. Do tej pory: Dzisiaj:

Wymagania edukacyjne na ocenę z informatyki klasa 3

Analiza danych pochodzących z sekwencjonowania nowej generacji - przyrównanie do genomu referencyjnego. - część I -

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

Efekt kształcenia. Ma uporządkowaną, podbudowaną teoretycznie wiedzę ogólną w zakresie algorytmów i ich złożoności obliczeniowej.

Jak Big Data rewolucjonizuje naukę oraz współpracę centrów badawczych z biznesem?

Zestawienie bibliograficzne do wystawy pt. Szkoła ćwiczeń zestawy materiałów edukacyjnych dla nauczycieli

PLAN STUDIÓW PODYPLOMOWYCH: DIAGNOSTYKA MOLEKULARNA W ROKU 2019/2020. Nazwa modułu ECTS Semestr I Semestr II. Liczba godzin z.

Informatyka kl. 1. Semestr I

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery

9. Metody dydaktyczne 10. Podstawowe informacje i zaliczone kursy z genetyki i biologii molekularnej oraz dobra znajom angielskiego.

Transkrypt:

http://theta.edu.pl/ Podstawy Bioinformatyki II BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH 1

Czym jest bioinformatyka? 2

Bioinformatyka Bioinformatyka jest interdyscyplinarną dziedziną nauki obejmującą wykorzystanie metod obliczeniowych do badania danych biologicznych Higgs P., Attwood T., Bioinformatyka i ewolucja molekularna Bioinformatyka a biologia obliczeniowa 3

Bioinformatyka Interdyscyplinarność : biologia (molekularna) dane biologiczne, biotechnologiczne dane dotyczące kwasów nukleinowych, białek, lipidów, węglowodanów i innych makrocząsteczek Informatyka i matematyka - narzędzia, metody i obliczenia komputerowe nauki i techniki komputerowe, matematyka stosowana, statystyka, teoria prawdopodobieństwa 4

Cele bioinformatyki Organizacja i zarządzanie informacjami o danych biologicznych w formie skomputeryzowanych zapisów BAZY DANYCH Analiza danych tworzenie NARZĘDZI (programów, metod, algorytmów) systemy operacyjne (Unix, Linux) języki programowania (C, C++, PERL, Python, Ruby, JAVA, R, FORTRAN, itd.) 5

Dane 6

Dane (NGS) 7

Dane (NGS) Wzrost olbrzymiej ilości i objętości surowych danych potrzeba gromadzenia danych potrzeba stworzenia skomplikowanych procedur komputerowych do zarządzania danymi JAKIEJ WIELKOŚCI MOGĄ BYĆ DANE NGS? 8

Dane (NGS) Format tekstowy Cały genom buhaja N = 50 172 242 9

Jednostki pamięci xxx KB xxx MB 1,44 KB 700 MB 4,7 GB 25 GB 10

Dane (NGS) Wzrost olbrzymiej ilości i objętości surowych danych potrzeba gromadzenia danych potrzeba stworzenia skomplikowanych procedur komputerowych do zarządzania danymi 1 osobnik (cały genom) Katedra Genetyki: 200 buhajów 32 krowy 11

Biologiczne bazy danych Pierwszorzędowe (pierwotne) Surowe dane biologiczne, archiwa sekwencji lub dane strukturalne wprowadzane do baz przez naukowców GenBank, PDB Drugorzędowe (wtórne) Informacje przetworzone komputerowo, lub poprawione ręcznie na podstawie oryginalnych informacji z pierwszorzędowych baz danych SWISS-PROT, PIR Specjalistyczne Specjalistyczne zagadnienia FlyBase, baza danych HIV, Ribosomal Database Project 12

Xiong J., 13 Podstawy bioinformatyki

Pobieranie informacji tworzenie zapytań Sformułowanie zapytań do baz danych często wymaga skorzystania z operatorów logicznych i konstruowania wyrażeń boolowskich (wskazanie powiązań, relacji pomiędzy słowami) AND, OR, NOT, (), itp. 14

Pułapki w bazach danych Dane niekompletne (np. niekompletna adnotacja) Błędy: - błędy technologii (np. sekwenatora), zanieczyszczenia - błędna adnotacja Rozprzestrzenianie błędów Wysoka redundacja informacji (non-redundant RefSeq) 15

www.ncbi.nlm.nih.gov 16

FORMATY DANYCH 17

Format GenBank Xiong J., 18 Podstawy bioinformatyki

Format GenBank Xiong J., 19 Podstawy bioinformatyki

Format GenBank Xiong J., 20 Podstawy bioinformatyki

Format FASTA Prosty Popularny Czytelny dla wielu programów do analizy bioinformatycznej Zapis sekwencji kwasów nukleinowych oraz białek (jednoliterowe skróty) Identyfikator sekwencji opis >gi 52693750 dbj AB175071.1 Neomys fodiens mitochondrial cytb gene for cytochrome b, complete cds ATGACCAACTTTCGAAAAACCCATCCATTAATAAAAATTCTTAACAACTCATTCATCGATCTCCCAGCCC CATCAAACATTTCATCATGATGAAATTTCGGGTCCCTTCTAGGATTGTGCCTAGTAATCCAGATCCTGAC TGGCCTCTTTCTAGCAATACATTACACTTCAGATACCATGACCGCCTTTTCATCAGTAACCCATATTTGT CGAGACGTCAACTATGGATGATTAATTCGATACCTACACGCTAATGGAGCATCTATATTTTTCATCTGCT 21

Komputerowy zapis sekwencji nukleotydowej Symbol Description Bases represented Symbol Description Bases represented A Adenine A C Cytosine C B not A (B comes after A) C G T G Guanine G T Thymine T U Uracil U W Weak A T S Strong C G M amino A C K Keto G T R purine A G Y pyrimidine C T 1 2 D H V N or - not C (D comes after C) not G (H comes after G) not T (V comes after T and U) any base (not a gap) A G T 3 A C T A C G A C G T 4 22

http://theta.edu.pl/ LISTA ZADAŃ 23