Bioinformatyka wykład I.2009

Podobne dokumenty
Public gene expression data repositoris

Proposal of thesis topic for mgr in. (MSE) programme in Telecommunications and Computer Science

Machine Learning for Data Science (CS4786) Lecture11. Random Projections & Canonical Correlation Analysis

1. KEGG 2. GO. 3. Klastry

BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE

BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE. Podstawy Bioinformatyki wykład 4

CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Ankiety Nowe funkcje! Pomoc Twoje konto Wyloguj. BIODIVERSITY OF RIVERS: Survey to students

Machine Learning for Data Science (CS4786) Lecture 11. Spectral Embedding + Clustering

Helena Boguta, klasa 8W, rok szkolny 2018/2019

Bioinformatyka wykład 10.I.2008

Stargard Szczecinski i okolice (Polish Edition)

Zakopane, plan miasta: Skala ok. 1: = City map (Polish Edition)

Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition)

MoA-Net: Self-supervised Motion Segmentation. Pia Bideau, Rakesh R Menon, Erik Learned-Miller

deep learning for NLP (5 lectures)

Towards Stability Analysis of Data Transport Mechanisms: a Fluid Model and an Application

Warsztaty Ocena wiarygodności badania z randomizacją

Zarządzanie sieciami telekomunikacyjnymi

ERASMUS + : Trail of extinct and active volcanoes, earthquakes through Europe. SURVEY TO STUDENTS.

GRY EDUKACYJNE I ICH MOŻLIWOŚCI DZIĘKI INTERNETOWI DZIŚ I JUTRO. Internet Rzeczy w wyobraźni gracza komputerowego

Motywacja. Do tej pory: Dzisiaj:

Probability definition

MaPlan Sp. z O.O. Click here if your download doesn"t start automatically

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

Twoje osobiste Obliczenie dla systemu ogrzewania i przygotowania c.w.u.

ANKIETA ŚWIAT BAJEK MOJEGO DZIECKA

Dr Katarzyna Wyrwa. Telefon: (+48 61) Zakład Biometrii i Bioinformatyki

Rozpoznawanie twarzy metodą PCA Michał Bereta 1. Testowanie statystycznej istotności różnic między jakością klasyfikatorów


Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

PODSTAWY BIOINFORMATYKI 6 BAZA DANYCH NCBI - II

PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS

Zestaw podręczników do biblioteki wydziałowej w ramach projektu BIOINFORMATYKA na rok 2010:

Planning and Cabling Networks

Numer ogłoszenia: ; data zamieszczenia: OGŁOSZENIE O ZMIANIE OGŁOSZENIA

DODATKOWE ĆWICZENIA EGZAMINACYJNE

Machine Learning for Data Science (CS4786) Lecture 24. Differential Privacy and Re-useable Holdout

Analysis of Movie Profitability STAT 469 IN CLASS ANALYSIS #2

Installation of EuroCert software for qualified electronic signature

Genetyka i biologia eksperymentalna studia I stopnia 2017/18/19/20

Tychy, plan miasta: Skala 1: (Polish Edition)

ITIL 4 Certification

JĘZYK ANGIELSKI ĆWICZENIA ORAZ REPETYTORIUM GRAMATYCZNE

Cel szkolenia. Konspekt

Raport bieżący: 44/2018 Data: g. 21:03 Skrócona nazwa emitenta: SERINUS ENERGY plc

A DIFFERENT APPROACH WHERE YOU NEED TO NAVIGATE IN THE CURRENT STREAMS AND MOVEMENTS WHICH ARE EMBEDDED IN THE CULTURE AND THE SOCIETY

Domy inaczej pomyślane A different type of housing CEZARY SANKOWSKI

Miedzy legenda a historia: Szlakiem piastowskim z Poznania do Gniezna (Biblioteka Kroniki Wielkopolski) (Polish Edition)

Formularz dla osób planujących ubiegać się o przyjęcie na studia undergraduate (I stopnia) w USA na rok akademicki

USB firmware changing guide. Zmiana oprogramowania za przy użyciu połączenia USB. Changelog / Lista Zmian

Tematy projektów HDiPA 2015


The Lorenz System and Chaos in Nonlinear DEs

HAPPY ANIMALS L01 HAPPY ANIMALS L03 HAPPY ANIMALS L05 HAPPY ANIMALS L07

HAPPY ANIMALS L02 HAPPY ANIMALS L04 HAPPY ANIMALS L06 HAPPY ANIMALS L08

1

Few-fermion thermometry

Stół Regolo. 100% Made in Italy. Może być używany w wersji zamkniętej lub otwartej na dowolnej wysokości It can be used open or closed, at any height

TEORIA CZASU FUTURE SIMPLE, PRESENT SIMPLE I CONTINOUS ODNOSZĄCYCH SIĘ DO PRZYSZŁOŚCI ORAZ WYRAŻEŃ BE GOING TO ORAZ BE TO DO SOMETHING

BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE. Pracownia Informatyczna 2

POLITYKA PRYWATNOŚCI / PRIVACY POLICY

OpenPoland.net API Documentation

XII International PhD Workshop OWD 2010, October Metodyka pozyskiwania i analizy wyników badań symulacyjnych ścieżek klinicznych

Zdecyduj: Czy to jest rzeczywiście prześladowanie? Czasem coś WYDAJE SIĘ złośliwe, ale wcale takie nie jest.

PLAN STUDIÓW. Rodzaj zajęć. e-nauczanie,

UMOWY WYPOŻYCZENIA KOMENTARZ

Previously on CSCI 4622

Camspot 4.4 Camspot 4.5

Revenue Maximization. Sept. 25, 2018

Instrukcja obsługi User s manual

Network Services for Spatial Data in European Geo-Portals and their Compliance with ISO and OGC Standards

Hard-Margin Support Vector Machines

Przedmiot Sztuk Cena jedn. netto/szt. Wydawnictwo PWN 1.Biochemia ( wyd.iv) Berg J.M., Stryer L., 20 Tymoczko J.L.

Zmiany techniczne wprowadzone w wersji Comarch ERP Altum

Katowice, plan miasta: Skala 1: = City map = Stadtplan (Polish Edition)

Epigenome - 'above the genome'

Weronika Mysliwiec, klasa 8W, rok szkolny 2018/2019

Kraków, 14 marca 2013 r.

Projekty Marie Curie Actions w praktyce: EGALITE (IAPP) i ArSInformatiCa (IOF)

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

Zestawienie czasów angielskich

"By leczyć ciało ludzkie, konieczna jest wiedza o całości zjawisk - przetestuj swój produkt w pierwszym

OSI Physical Layer. Network Fundamentals Chapter 8. Version Cisco Systems, Inc. All rights reserved. Cisco Public 1

Bioinformatyka. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2010/2011. Krzysztof Pawłowski

Emilka szuka swojej gwiazdy / Emily Climbs (Emily, #2)

Genetyka i biologia eksperymentalna studia I stopnia 2017/18/19

Presented by. Dr. Morten Middelfart, CTO

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 8: Structured PredicCon 2

Has the heat wave frequency or intensity changed in Poland since 1950?

Bioinformatyka. Krzysztof Pawłowski. wykłady dla I r. studiów magisterskich, biologia (SGGW) 2012 / 2013

Blow-Up: Photographs in the Time of Tumult; Black and White Photography Festival Zakopane Warszawa 2002 / Powiekszenie: Fotografie w czasach zgielku


archivist: Managing Data Analysis Results

Dolny Slask 1: , mapa turystycznosamochodowa: Plan Wroclawia (Polish Edition)

SNP SNP Business Partner Data Checker. Prezentacja produktu

ARNOLD. EDUKACJA KULTURYSTY (POLSKA WERSJA JEZYKOWA) BY DOUGLAS KENT HALL

Systemy wbudowane. Poziomy abstrakcji projektowania systemów HW/SW. Wykład 9: SystemC modelowanie na różnych poziomach abstrakcji

Sargent Opens Sonairte Farmers' Market

Transkrypt:

Bioinformatyka wykład 13 20.I.2009 biologia systemów biologiczne dane wielowymiarowe Krzysztof Pawłowski Krzysztof_Pawlowski@sggw.pl 2009-01-22 1

Plan wykładu Biologia systemów Bazy danych ekspresji genów Analiza danych ekspresji genów, sieci zależności Symulacje ścieżek sygnalizacyjnych Pan-genomy 2009-01-22 2

Systems biology field of study, particularly, the study of the interactions between the components of biological systems paradigm : "Systems biology...is about putting together rather than taking apart, integration rather than reduction 2009-01-22 3

Systems biology since 1993? 2009-01-22 4

Terminologia wielkoskalowe analizy biologiczne = high-throughput biology = omics (genomics, proteomics, metabonomics,...) 2009-01-22 5

Typowe zastosowania analiz wielkoskalowych Poszukiwanie molekularnych cech charakterystycznych zjawisk i procesów biologicznych, np. biomarkerów diagnostycznych Poszukiwanie molekularnych mechanizmów zjawisk i procesów biologicznych, np. możliwych scenariuszy terapeutycznych 2009-01-22 6

Gdzie lepiej widać biologię? 2009-01-22 7

Gdzie lepiej widać biologię? 2009-01-22 8

Plan wykładu Biologia systemów Bazy danych ekspresji genów Analiza danych ekspresji genów, sieci zależności Symulacje ścieżek sygnalizacyjnych Pan-genomy 2009-01-22 9

Ekspresja genów to nie tylko dane liczbowe w przestrzeni genów można określić wiele metryk próbki geny zdrowi chorzy 2009-01-22 10

Ekspresja genów to nie tylko dane liczbowe z każdą próbką związane mogą być setki parametrów, liczbowych i jakościowych próbki dane demograficzne, kliniczne, historia chorób, styl życia geny zdrowi chorzy 2009-01-22 11

Bioinformatyka wielkoskalowa High-throughput bioinformatics 2009-01-22 12

Bioinformatyka wielkoskalowa High-throughput bioinformatics 2009-01-22 13

interpretacja: od list genów o zmienionej ekspresji do zrozumienia biologii Analiza skupień (clustering) Analiza wzbogacenia zbiorów genów (gene set enrichment analysis) Mapowanie danych ekspresji na sieci zależności biologicznych 2009-01-22 14

Przykłady metod analizy danych ekspresji Analiza skupień (clustering) Poszukiwanie grup genów o podobnych profilach ekspresji 2009-01-22 15

interpretacja: od list genów o zmienionej ekspresji do zrozumienia biologii Analiza wzbogacenia zbiorów genów (gene set enrichment analysis) poszukiwanie cech, w które pewne grupy genów, np. skupienia (klastry), są wzbogacone np. anotacji funkcjonalnych statystyczna analiza anotacji 2009-01-22 16

interpretacja: od list genów o zmienionej ekspresji do zrozumienia biologii Mapowanie danych ekspresji na sieci zależności biologicznych wyszukiwanie podsieci (subnetworks) złożonych z genów o charakterystycznej ekspresji 2009-01-22 17

Biomedical Entity Relationship System Literature Gene Expression Proteomic Metabonomic Significant Biological Entity List: Gene List Protein List Metabolite List Biomedical Entity Relationship System Question: What is the underlying biology, pathology, physiology etc associated with this list of entities? What is it telling me? Biological environment of the list. A software tool that enables the user to rapidly extract biological information from biological entity lists Canonical pathways associated with the list A map of the Genetic relationships within the literature focusing on gene/protein, metabolite, drug, 2009-01-22 disease, biological Diseases, Biological process concepts processes and 18 associated their with relationships the list

Nowe odkrycia novelty Trend. Czy tworzymy więcej nowości? Czy mamy modę na chwalenie się rzekomą nowością? Czy analizy wielkoskalowe prowadzą do odkrywania nowości? 2009-01-22 19

Czy omika prowadzi do nowości? temat 1 oraz temat 2 Liczba artykułów % omiki omika - 116821 100% omika omika nowe geny geny docelowe dla leków 1591 1,4% 596 0,5% Kwerenda w Medline 2000-2007, tytuły i streszczenia 2009-01-22 20

Sposoby i powody unikania nowości Wczesne analizy wielkoskalowe miały charakter proof-of-concept kontroli technicznej metody Niewiara w dokładność metod wielkoskalowych Skupienie uwagi na znanych genach i scenariuszach powody praktyczne (łatwiejsze zastosowania) Bioinformatyka daje szansę na pełniejsze wykorzystanie danych wielkoskalowych 2009-01-22 21

Sposoby i powody unikania nowości Przykład: Crystal et al. Skupienie uwagi na znanych genach i scenariuszach. Przeanalizowali 44 geny spośród 22000 o zmierzonej ekspresji Am J Respir Cell Mol Biol. (2003) 29):331-43 2009-01-22 22

Biologia systemów Gene-centric approach vs gene-set (pathway) approach differentially expressed pathways instead of differentially expressed genes 2009-01-22 23

Plan wykładu Biologia systemów Bazy danych ekspresji genów Analiza danych ekspresji genów, sieci zależności Symulacje ścieżek sygnalizacyjnych Pan-genomy 2009-01-22 24

We want to inhibit a signalling pathway: receptor protein to biological effect. Simple? 2009-01-22 25

Not so simple. Sets of differential equations used 2009-01-22 26

Symulacje ścieżek sygnalizacyjnych Lauffenburger et al. (2008), Interleukin-7 receptor signaling network 2009-01-22 27

2009-01-22 28

2009-01-22 29

Plan wykładu Biologia systemów Bazy danych ekspresji genów Analiza danych ekspresji genów, sieci zależności Symulacje ścieżek sygnalizacyjnych Pan-genomy 2009-01-22 30

pan-genome The microbial pan-genome, Medini et al. (2005) how genomics can describe a bacterial species? in some species, new genes are discovered even after sequencing the genomes of several strains mathematical modeling predicts that new genes will be discovered even after sequencing hundreds of genomes per species. a bacterial species can be described by its pan-genome, a core genome containing genes present in all strains, a dispensable genome containing genes present in two or more strains genes unique to single strains pan-genome of a bacterial species might be orders of magnitude larger than any single genome 2009-01-22 31

Geny wspólne różne gatunki z rodzaju Streptococcus 2009-01-22 32

pan-genome core genome Trzy gatunki z rodzaju Streptococcus 2009-01-22 33

What future brings? growing apprehension of multidimensionality in biology combining macroscopic (e.g. clinical) science and molecular biology: global and molecular phenotype comparative genomics, community genomics functional network analysis, simulation of pathways - enzymatic, signalling, regulatory whole cell simulations, and beyond automated text mining integration, integration, integration,. 2009-01-22 34