Architektura dużych projektów bioinformatycznych

Podobne dokumenty
Architektura dużych projektów bioinformatycznych

Obliczenia Naukowe. Wykład 11:Pakiety do obliczeń: naukowych i inżynierskich Przegląd i porównanie. Bartek Wilczyński

Komputerowe Wspomaganie Obliczeń. dr Robert Kowalczyk

PWSZ w Tarnowie Instytut Politechniczny Elektrotechnika

Wspomaganie obliczeń matematycznych. dr inż. Michał Michna

dr inż. Michał Michna WSPOMAGANIE OBLICZEŃ MATEMATYCZNYCH

Statystyka I z R. Bartosz Maćkiewicz. 2 października 2017

Wspomaganie obliczeń matematycznych. dr inż. Michał Michna

Informatyka. Wykład 0. Witold Dyrka 13/2/2012

Wprowadzenie do er(k)a

Pakiety matematyczne. Matematyka Stosowana. dr inż. Krzysztof Burnecki

Rozwiązywanie równań różniczkowych zwyczajnych za pomocą komputera

Pakiet webmathematica jako narzędzie wspomagające proces dydaktyczny przedmiotu mechanika. Łukasz Maciejewski, Wojciech Myszka, Stanisław Piesiak

Pakiet matlab odpowiednie narzędzie w nowoczesnym laboratorium. Karol Józefowicz. Państwowa Wyższa Szkoła Zawodowa w Lesznie, Instytut Politechniczny

Obliczenia inżynierskie. oprogramowanie matematyczne

WYDZIAŁ MATEMATYKI.

Infrastruktura PLGrid Nowa jakość usług informatycznych w służbie nauki

Informatyczne fundamenty

Wykorzystanie wolnego oprogramowania w nauce

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015

Naukowe Koło Nowoczesnych Technologii

Spis treści. I. Skuteczne. Od autora... Obliczenia inżynierskie i naukowe... Ostrzeżenia...XVII

Tematy prac dyplomowych inżynierskich

Wstęp do Informatyki dla bioinformatyków

Pisząc okienkowy program w Matlabie wykorzystujemy gotowe obiekty graficzne, lub możemy tworzyć własne obiekty dziedzicząc już zdefiniowane.

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia

Rok akademicki: 2014/2015 Kod: CCB s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Nadzorowanie stanu serwerów i ich wykorzystania przez użytkowników

Pakiety matematyczne. Matematyka Stosowana. dr inż. Krzysztof Burnecki

MATHCAD OBSŁUGA PROGRAMU

Zamieszczanie ogłoszenia: obowiązkowe. Ogłoszenie dotyczy: zamówienia publicznego.

Podstawy analizy danych numerycznych w języku Python

PRZEWODNIK PO PRZEDMIOCIE

Rozwiązywanie równań liniowych. Transmitancja. Charakterystyki częstotliwościowe

Język nowoczesnej analizy danych BARTOSZ SĘKIEWICZ

Kierunek: Informatyka Stosowana Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

egroupware czy phpgroupware jest też mniej stabilny.

PRZETWARZANIE I ORGANIZOWANIE DANYCH: ARKUSZ KALKULACYJNY

Kurs wybieralny: Zastosowanie technik informatycznych i metod numerycznych w elektronice

Otwarte środowisko aplikacji matematycznych SAGE w (samo)kształceniu fizyczno-informatycznym

Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach PROGRAM KSZTAŁCENIA. Studia III stopnia (doktoranckie) kierunek Informatyka

Kierunek: Informatyka Stosowana Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

Top 38 w roku GeoGebra

Kierunek studiów: EKONOMIA Specjalność: Analityka gospodarcza

Bioinformatics for Science. Tomasz Puton

Klaster obliczeniowy

Aplikacje WWW i PHP - opis przedmiotu

Dwuletnie studia indywidualne II stopnia na kierunku fizyka, specjalność Metody fizyki w ekonomii (ekonofizyka)

Wykorzystanie programów komputerowych do obliczeń matematycznych, cz. 2/2

KARTA KURSU (realizowanego w module specjalności) Metody numeryczne

Studia I stopnia, stacjonarne 3,5 letnie kierunek: EDUKACJA TECHNICZNO-INFORMATYCZNA Specjalność: nauczycielska profil kształcenia: praktyczny

OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak

PROGRAM STUDIÓW. WYDZIAŁ: Podstawowych Problemów Techniki KIERUNEK: Matematyka stosowana

Biorąc udział w projekcie, możesz wybrać jedną z 8 bezpłatnych ścieżek egzaminacyjnych:

Pakiety użytkowe - opis przedmiotu

Program nauczania informatyki w gimnazjum Informatyka dla Ciebie. Modyfikacja programu klasy w cyklu 2 godzinnym

Matlab - zastosowania Matlab - applications. Informatyka II stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny)

Nowoczesne metody nauczania przedmiotów ścisłych

Kierunek: Informatyka Stosowana Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

Rok akademicki: 2016/2017 Kod: JIS s Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

KARTA KURSU. Kod Punktacja ECTS* 2

KIERUNKOWE I SPECJALNOŚCIOWE EFEKTY KSZTAŁCENIA

Wykład Ćwiczenia Laboratorium Projekt Seminarium 15 30

zna metody matematyczne w zakresie niezbędnym do formalnego i ilościowego opisu, zrozumienia i modelowania problemów z różnych

Rok akademicki: 2014/2015 Kod: EAR IS-s Punkty ECTS: 4. Kierunek: Automatyka i Robotyka Specjalność: Informatyka w sterowaniu i zarządzaniu

Zastosowanie pakietów algebry komputerowej do obliczeń numerycznych i symbolicznych

Podstawowe informacje o module

Simulink MATLAB Przegląd obiektów i przykłady zastosowań

Aparaty słuchowe Hi-Fi z Multiphysics Modeling

Dostawa oprogramowania. Nr sprawy: ZP /15

EFEKTY UCZENIA SIĘ DLA KIERUNKU INŻYNIERIA DANYCH W ODNIESIENIU DO EFEKTÓW UCZENIA SIĘ PRK POZIOM 6

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2018/2019

Kierunek: Inżynieria i Analiza Danych Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

KARTA MODUŁU (część I)

Repetytorium z matematyki 3,0 1,0 3,0 3,0. Analiza matematyczna 1 4,0 2,0 4,0 2,0. Analiza matematyczna 2 6,0 2,0 6,0 2,0

PLAN STUDIÓW STACJONARNYCH PIERWSZEGO STOPNIA DLA KIERUNKU MATEMATYKA NA WYDZIALE MATEMATYKI, INFORMATYKI I EKONOMETRII UNIWERSYTETU ZIELONOGÓRSKIEGO

Wykorzystanie programów komputerowych do obliczeń matematycznych, cz. 2/2

KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Pakiety matematyczne i informatyczne. 2. KIERUNEK: Matematyka. 3. POZIOM STUDIÓW: I stopnia

Rok akademicki: 2013/2014 Kod: STC s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Open AGH i inne platformy Otwartych Zasobów Akademickich. Karolina Grodecka Centrum e-learningu AGH Koalicja Otwartej Edukacji

Warsztaty z modelowania i symulacji procesów chemicznych w programie

Język Java i technologie Web - opis przedmiotu

bo od menedżera wymaga się perfekcji ANKIETY ONLINE W SYSTEMIE BUSINESS NAVIGATOR

Informatyka w medycynie Punkt widzenia kardiologa

Access Engineering to multimedialna baza/platforma wiedzy dla : naukowców inżynierów kadry dydaktycznej studentów

Międzyplatformowy interfejs systemu FOLANessus wykonany przy użyciu biblioteki Qt4

Projekt przejściowy 2015/2016 BARTOSZ JABŁOŃSKI, TOMASZ JANICZEK

Jakość i otwartość: # otwarte e-podręczniki akademickie AGH

Informatyka. MATLAB Zasady zaliczenia Wykład. Plan tematów. Literatura. Wykład 1 45 min. 10/7/2013

Technologia Informacyjna

Studia I stopnia, stacjonarne 3,5 letnie kierunek: EDUKACJA TECHNICZNO-INFORMATYCZNA Specjalność: nauczycielska profil kształcenia: praktyczny

Kierunek: Matematyka Poziom studiów: Studia II stopnia Forma i tryb studiów: Stacjonarne

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa

Infrastruktura PLGrid: narzędzia wsparcia w nauce i dydaktyce. Mariola Czuchry, Klemens Noga, Katarzyna Zaczek. ACK Cyfronet AGH

Historia systemów operacyjnych - Unix

Elektrotechnika I stopień Ogólno akademicki. Przedmiot kierunkowy. Obowiązkowy Polski VI semestr zimowy

Wolne oprogramowanie. - bądź legalny za darmo

Kierunek i poziom studiów: Chemia, pierwszy. Sylabus modułu: Technologia informacyjna (0310-CH-S1-003) 1. Informacje ogólne

Transkrypt:

Architektura dużych projektów bioinformatycznych Pakiety do obliczeń: naukowych, Inżynierskich i statystycznych Przegląd i porównanie Bartek Wilczyński 10.4.2019

Plan na przyszły tydzień: quiz Kto używał debugerów: pdb, pycharm, idle Kto używał profilerów: profile,cprofile, kernprofiler, runsnakerun Kto używał narzędzi do benchmarkowania: timeit, pystone, etc. Kto używał modułu inspect Kto używał systemów do logowania/raportowania błędów (logging, warnings)?

Plan na dziś Pakiety do obliczeń: przegląd zastosowań różnice w zapotrzebowaniu: naukowcy, inżynierowie, statystycy/medycy Matlab/octave/scipy S-Plus/SPSS/projekt R Mathematica/Maxima/Sage Pakiety komercyjne vs. Open Source Excel?

Typowi użytkownicy pakietów obliczeniowych Inżynierowie i projektanci (budownictwo, lotnictwo, motoryzacja, itp.) Naukowcy doświadczalni (fizycy, chemicy, materiałoznawcy, itp.) Statystycy (zastosowania w medycynie, ekonomii, biologii molekularnej, psychologii, socjologii, ubezpieczeniach, itp.) Matematycy (przede wszystkim matematyka stosowana )

Obliczenia naukowe Komputer jako potężniejszy kalkulator W zasadzie wszystko można zaprogramować samemu, ale każdemu mogą się przydać: Interfejs użytkownika łatwiejszy niż typowego kompilatora Możliwość zaawansowanej grafiki Dobrze przetestowane standardowe procedury Interfejsy do urządzeń Wsparcie fachowców

Matlab i pakiety inżynierskie Rozwijany w latach 70'tych przeze Clive Moler'a jako narzędzie dla studentów informatyki, aby nie musieli używać zaawansowanych bibliotek fortranu Firma mathworks powstaje w 1984 i wydaje pierwszą wersję Matlab'a Najpopularniejszy wśród inżynierów, dobre całki numeryczne, rozwiązywanie równań i wykresy (również 3d) Bardzo popularny także do przetwarzania sygnałów i symulacji (simulink) Licencja komercyjna niedrogi dla studentów, droższy dla uczelni, bardzo drogi dla przemysłu

Toolbox'y Matlab'a Wiele dodatkowych (płatnych) bibliotek dla specjalistów Symbolic math Image processing Financial toolbox Bioinformatics Optimization SimBiology

Alternatywy opensource GNU Octave (rozpoczęty w 1988, wydania od 1992, rozwijany przez John'a W. Eatona, chemika z University of Wisconsin-Madison) W zasadzie kompatybilny z Matlab'em John W. Eaton Inc. - consulting, firma, która czerpie dochody z konsultingu Octave a SciLab dawniej psilab, rozwijany od lat 90tych w INRIA we Francji, przekształcony w spółkę Scilab enterprises, przejęty w 2017 przez ESI Group, dostępny na licencji GNU Scipy stack zestaw bibliotek python'a do obliczeń naukowych Wiele bibliotek, rozwijanych przez niezależne grupy System pakietów, edytor i dystrybucja organizowana przez firmę Enthought, również komercyjne dystrybucje i konsulting Wiele konferencji tematycznych dla naukowców I pracowników przemysłu - także źródło dochodu

Interfejs Octave

Interfejs Enthought Canopy

S-Plus dla statystyków Język S zaprojektowany w laboratoriach Bell Labs przez Johna Chambers'a Implementacja przez R. Douglas'a Martina, profesora statystyki w Seattle Wydany komercyjnie w 1988 jako S-Plus, potem kolejno przejmowany przez różne korporacje aż do 2008, kiedy przejęła go firma TIBCO Adresowany do statystyków akademickich I przemysłowych Ogólny, bez specjalizacji w jakiejś dziedzinie zastosowań

Projekt R Implementacja OpenSource języka S Rozpoczęty ok. 1995 projekt stworzenia darmowej implementacji języka S Ross Ithaka (obecnie Genentech) and Robert Gentelman (obecnie Univ. Auckland) W tej chwili zarządzany przez R foundation Wiele firm wspierających R Zachęcam do obejrzenia slajdów Chambers'a: www.r-project.org/user-2006/slides/chambers.pdf

Rstudio interfejs do R'a

System pakietów w R Istotna jest możliwość rozwijania własnych pakietów w R (coś na kształt toolbox'ów Matlab'a) Jest to proces całkowicie demokratyczny, każdy może wysłać pakiet i umieścić go w repozytorium CRAN (Comprehensive R Archive Network) Możliwość automatycznej instalacji pakietów z CRAN Pewne standardy dokumentacji (winiety) zgodne z literate programming

Bioconductor Dystrybucja wybranych pakietów R do analizy danych biomedycznych Nacisk na łatwiejszą instalację i lepszą dokumentację pakietów Stabilny cykl wydań (2 razy do roku) Szkolenia adresowane do biologów I medyków Kompletnie not-for-profit Finansowany z grantów (ok 7-8 osób core team)

Obliczenia symboliczne - Mathematica Opracowana w latach 1980'tych przez Stephen'a Wolframa Jeden z pierwszych w historii pakietów umożliwiających obliczenia symboliczne Bardzo popularna wśród studentów amerykańskich, którzy muszą zaliczyć rachunek różniczkowy Obecnie także w wersji online: Wolfram Alpha Konkurencyjne pakiety: Maple, Mathcad

Mathematica - interfejs

Obliczenia symboliczne Open Source Maxima (1992-), a wcześniej Macsyma (1968-1982) Wydana w 1998 na licencji GPL Napisana w języku lisp Wiele konkurencyjnych interfejsów (WXMaxima, Gmaxima itp) Maxima skupiona na obliczeniach symbolicznych, bez większej funkcjonalności w numeryce

SAGE math cloud (dawniej sage notebook) Stosunkowo nowy projekt (inny niż sage synapse) Połączenie wielu środowisk obliczeniowych Python (Numpy, Scipy, Sympy, matplotlib, Networkx) Maxima R GAP, FLINT, GD, JMOL, PALP, Singular Środowisko w przeglądarce, sesja na serwerze lub w chmurze

Interfejs SAGE

Excel? Najpopularniejszy pakiet do obliczeń Bardzo prosty interfejs Często stosowany również w bio-informatyce Ma spore ograniczenia (np. Maksymalna liczba linii w arkuszu), które utrudniają rozwój projektów prowadzonych w arkuszu Brak możliwości efektywnego testowania, brak debuggerów