Public gene expression data repositoris GEO [Jan 2011]: 520 k samples 21 k experiments Homo, mus, rattus Bos, sus Arabidopsis, oryza, Salmonella, Mycobacterium et al. 17.01.11 14
17.01.11 15
17.01.11 16
profil ekspresji jednego genu 17.01.11 17
symatlas.gnf.org/symatlas tkankowe profile ekspresji 17.01.11 18
17.01.11 19
www.ebi.ac.uk/arrayexpress/ 17.01.11 20
Ekspresja genów to nie tylko dane liczbowe w przestrzeni genów można określić wiele metryk próbki geny zdrowi chorzy 17.01.11 21
Ekspresja genów to nie tylko dane liczbowe z każdą próbką związane mogą być setki parametrów, liczbowych i jakościowych próbki dane demograficzne, kliniczne, historia chorób, styl życia geny zdrowi chorzy 17.01.11 22
Bioinformatyka wielkoskalowa High-throughput bioinformatics 17.01.11 23
interpretacja: od list genów o zmienionej ekspresji do zrozumienia biologii Analiza skupień (clustering) Analiza wzbogacenia zbiorów genów (gene set enrichment analysis) Mapowanie danych ekspresji na sieci zależności biologicznych Statystyczna analiza anotacji 17.01.11 24
High throughput bioinformatics Gene Expression Proteomic Metabonomic Genetic Significant Biological Entity List: Gene List Protein List Metabolite List Literature (Gene/Metabolite Knowledgebase) Question: What is the underlying biology, pathology, physiology etc associated with this list of entities? What is it telling me? Evidence Trail Biological environment of the list. Canonical pathways associated with the list Diseases, Biological processes associated with the 17.01.11 list 25 Hypothesis Generation
Nowe odkrycia novelty Trend. Czy tworzymy więcej nowości? Czy mamy modę na chwalenie się rzekomą nowością? Czy analizy wielkoskalowe prowadzą do odkrywania nowości? 17.01.11 26
Czy omika prowadzi do nowości? temat 1 oraz temat 2 Liczba artykułów % omiki omika - 116821 100% omika omika nowe geny geny docelowe dla leków 1591 1,4% 596 0,5% Kwerenda w Medline 2000-2007, tytuły i streszczenia 17.01.11 27
Sposoby i powody unikania nowości Wczesne analizy wielkoskalowe miały charakter proof-of-concept kontroli technicznej metody Niewiara w dokładność metod wielkoskalowych Skupienie uwagi na znanych genach i scenariuszach powody praktyczne (łatwiejsze zastosowania) Metody wykorzystujące dane literaturowe i anotacje funkcjonalne w zasadzie wykluczają analizę nowości 17.01.11 28
Przykład: Sposoby i powody unikania nowości baza danych GEO w NCBI, popularne siostrzane mikromacierze (dwie połówki transkryptomu) U133A: 478 serii eksperymentów U133B: 81 serii 17.01.11 29
Sposoby i powody unikania nowości Przykład: Crystal et al. Skupienie uwagi na znanych genach i scenariuszach. Przeanalizowali 44 geny spośród 22000 o zmierzonej ekspresji 17.01.11 30 Am J Respir Cell Mol Biol. (2003) 29):331-43
Biologia systemów Gene-centric approach vs gene-set (pathway) approach differentially expressed pathways instead of differentially expressed genes 17.01.11 31
We want to inhibit a signalling pathway: receptor protein to biological effect. Simple? 17.01.11 32
Not so simple. Sets of differential equations used 17.01.11 33
Symulacje ścieżek sygnalizacyjnych Lauffenburger et al, IL7R 17.01.11 34
What future brings? Recent trends: Growing apprehension of multidimensionality in biology Combining clinical science and biology: global and molecular phenotype, Comparative genomics, personal genomics Functional network reconstruction from data Simulation of pathways - enzymatic, signalling, regulatory Automated text mining Whole cell simulations, and beyond integration, integration, integration,. 17.01.11 35