Obiekty Badawcze długoterminowe przechowywanie eksperymentów naukowych. Piotr Hołubowicz, Raúl Palma Poznańskie Centrum Superkomputerowo-Sieciowe



Podobne dokumenty
Rozwój polskich bibliotek cyfrowych. Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe

Europeana Cloud: Wykorzystanie technologii chmurowych do współdzielenia on-line baz danych dziedzictwa kulturowego

epuap Opis standardowych elementów epuap

Federacja Bibliotek Cyfrowych w sieci PIONIER

Marcin Heliński, Cezary Mazurek, Tomasz Parkoła, Marcin Werla

Infrastruktura bibliotek cyfrowych

Marcin Werla Poznańskie Centrum Superkomputerowo-Sieciowe

Arkadiusz Kuchto, Prezes Zarządu, Online Technologies

Instytut Technik Innowacyjnych Semantyczna integracja danych - metody, technologie, przykłady, wyzwania

Win Admin Replikator Instrukcja Obsługi

ZARZĄDZANIE RELACJAMI Z KLIENTEM system CRM. Ewa Woźniak, Krzysztof Wieczorek gr. MSP2

BMC Control-M Wybrane przypadki zastosowania

OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak

Agregacja metadanych zbiorów polskich instytucji kultury działania Poznańskiego Centrum Superkomputerowo-Sieciowego

Uslugi chmurowe dla nauki na podstawie BonFIRE

Architektury i protokoły dla budowania systemów wiedzy - zadania PCSS w projekcie SYNAT

Jak spełnić wymagania Pilotażu otwartych danych badawczych w Horyzoncie 2020?

Repozytorium Cyfrowe BN

SYSTEM VILM ZARZĄDZANIE CYKLEM ŻYCIA ŚRODOWISK WIRTUALNYCH. tel: +48 (032)

Zapewnij sukces swym projektom

Czytelnik w bibliotece cyfrowej

Hurtownie danych - przegląd technologii

SharePoint 2013 / Project Server 2013 Demand Management. Bartłomiej Graczyk

Funkcje backendu konfiguratora. Warszawa,

Od papierowych procedur do automatycznych procesów biznesowych w urzędzie dobre praktyki Michał Prusaczyk

Hurtownie danych - przegląd technologii

Czym jest system antyplagiatowy? Andrzej Sobecki

Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu

Marcin Werla Poznańskie Centrum Superkomputerowo-Sieciowe

Procesowa specyfikacja systemów IT

Wyzwania techniczne związane z prezentacją dziedzictwa kulturowego w Internecie

Rozwój Wielkopolskiej Biblioteki Cyfrowej a zmiany funkcjonalności systemu dlibra

Platforma epuap. 1-3 marca 2011

Rozwój bibliotek cyfrowych w Polsce. Cezary Mazurek Tomasz Parkoła Marcin Werla

kompleksowe oprogramowanie do zarządzania procesem spawania

Zarządzanie Zapasami System informatyczny do monitorowania i planowania zapasów. Dawid Doliński

Tworzenie kopii zapasowych i archiwalnych

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Federacja Bibliotek Cyfrowych: wsparcie instytucji kultury w udostępnianiu zbiorów on-line, agregacja metadanych na potrzeby Europeany

Zaawansowane narzędzia programowania rozproszonego

Geoportal monitoringu środowiska województwa lubelskiego, jako forma informowania społeczeństwa o stanie środowiska w województwie

TWORZĘ WŁASNĄ STRONĘ INTERNETOWĄ (BLOG)

TOPWEB SPSall Budowanie portalu intranetowego

Biblioteki cyfrowe główne kierunki rozwoju

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,

System INTEGRYB jako zintegrowane repozytorium danych umożliwiające zaawansowaną analitykę badawczą

Nowoczesne biblioteki cyfrowe w środowisku rozproszonych usług atomowych Modern digital libraries in the environment of distributed atomic services

Wymagania zaliczenia zajęć SCADA

Zintegrowany system zarządzania wiedzą w wytwarzaniu produktów leczniczych

AUMS Digital. aums.asseco.com

Krok w stronę cyfrowej humanistyki infrastruktura IT dla badań humanistycznych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Sprawne zarządzanie obrotem gotówkowym

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

Teraz bajty. Informatyka dla szkół ponadpodstawowych. Zakres rozszerzony. Część 1.

BIM Executive projektowanie, koordynacja i wdrażanie nowoczesnych projektów budowlanych

Baza danych systemu systemu zarządzania energią w szpitalach wojewódzkich Wprowadzenie Katowice r.

Część I Rozpoczęcie pracy z usługami Reporting Services

Innowacyjne narzędzia w procesie digitalizacji

Wsparcie Badań nad Wykorzystaniem Potencjału Technologii Chmur Obliczeniowych. Bartek Palak Poznańskie Centrum Superkomputerowo-Sieciowe

Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

Usługi i narzędzia QCG

Zagadnienia (1/3) Data-flow diagramy przepływów danych ERD diagramy związków encji Diagramy obiektowe w UML (ang. Unified Modeling Language)

PROJEKT INTERFEJSU UśYTKOWNIKA PROJEKT <NAZWA PROJEKTU> WERSJA <NUMER WERSJI DOKUMENTU>

Polityka prywatności

SHAREPOINT SHAREPOINT QM SHAREPOINT DESINGER SHAREPOINT SERWER. Opr. Barbara Gałkowska

HomeNetMedia - aplikacja spersonalizowanego dostępu do treści multimedialnych z sieci domowej

ZARZĄDZANIE DOKUMENTACJĄ. Tomasz Jarmuszczak PCC Polska

Sprawa numer: BAK.WZP Warszawa, dnia 16 sierpnia 2016 r.

Czy (centralne) katalogi biblioteczne są jeszcze potrzebne? OPAC w infotopii. Dr hab. Marek Nahotko, ISI UJ

Praca dyplomowa. Program do monitorowania i diagnostyki działania sieci CAN. Temat pracy: Temat Gdańsk Autor: Łukasz Olejarz

Spis treści. Dzień 1. I Wprowadzenie (wersja 0906) II Dostęp do danych bieżących specyfikacja OPC Data Access (wersja 0906) Kurs OPC S7

Możliwości i wyzwania dla polskiej infrastruktury bibliotek cyfrowych

zautomatyzować przepływ pracy w branży opakowań

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery

Instrukcja rejestracji w systemie System Wspierający Prowadzenie Prac Badawczo-Naukowych oraz Współdzielenie i Publikację Wyników Prac

Praktyczne wykorzystanie mechanizmów zabezpieczeń w aplikacjach chmurowych na przykładzie MS Azure

Infrastruktura PL-LAB2020

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Wykorzystanie regionalnej biblioteki cyfrowej do tworzenia repozytorium instytucjonalnego

Zintegrowany System Wiedzy oraz Wielofunkcyjne Repozytorium Danych Źródłowych podstawy technologiczne. Marcin Werla, PCSS

Integracja systemu dlibra i Manuscriptorium. Marcin Werla, PCSS

Microsoft SharePoint 2016 : krok po kroku / Olga Londer, Penelope Coventry. Warszawa, Spis treści

ASAP Akademicki System Archiwizacji Prac

Kurs Wizualizacja z WinCC SCADA - Zaawansowany. Spis treści. Dzień 1. I VBS w WinCC podstawy programowania (zmienne, instrukcje, pętle) (wersja 1410)

Integracja APD z Ogólnopolskim Repozytorium Prac Dyplomowych i Otwartym Systemem Antyplagiatowym

Kanał teletransmisji Bankowego Funduszu Gwarancyjnego (Portal BFG STP) Warszawa, 3 sierpnia 2017 r.

Rola bibliotek cyfrowych w budowaniu gospodarki opartej o wiedzę. Cezary Mazurek

Aplikacje internetowe - opis przedmiotu

Opis Modułu NSO. rozszerzenia asist o sprawozdania obowiązkowe dla NBP. Sierpień 2017

Aplikacja mobilna Jakość powietrza w Polsce

Dobre Praktyki w zakresie ewidencji Zbiorów Danych Przestrzennych w zagospodarowaniu przestrzennym oraz edytowania metadanych

Budowa uniwersalnej architektury dla Laboratorium Wirtualnego

Twórz, zarządzaj i dziel się wiedzą z zespołem!

Fuzzing OWASP The OWASP Foundation Piotr Łaskawiec J2EE Developer/Pentester

A. Instalacja serwera www

Systemy Informacji Przestrzennej

Win Admin Replikator Instrukcja Obsługi

Programowanie MorphX Ax

OfficeObjects e-forms

Transkrypt:

Obiekty Badawcze długoterminowe przechowywanie eksperymentów naukowych Piotr Hołubowicz, Raúl Palma Poznańskie Centrum Superkomputerowo-Sieciowe

Plan prezentacji» Przechowywanie eksperymentów naukowych» Obiekty badawcze» Struktura» Cykl życia» Narzędzia Wf4Ever» Dalsze kierunki prac» Pytania? 2

Wstęp Procesy obliczeniowe w dzisiejszej nauce» Badania naukowe prowadzone są w sposób coraz bardziej zinformatyzowany» Coraz więcej danych zdigitalizowanych, dostępnych w sieci» Digitalizacji zaczynają podlegać także metody powstają cyfrowe eksperymenty in silico» Nowe obiekty cyfrowe to nowe możliwości, ale i wyzwania Surowe dane Wyniki Proces obliczeniowy 3

Wstęp Workflow zautomatyzowany przepływ pracy Typowym przykładem automatyzacji metod są przepływy pracy (ang. workflow)» Naukowy przepływ pracy to precyzyjna, wykonywalna specyfikacja procedury naukowej sekwencji operacji na danych» Każda operacja reprezentuje proces obliczeniowy» Może być realizowany przez zewnętrzną usługę sieciową» Może używać zewnętrznych źródeł danych dostępnych w sieci 4

Przechowywanie eksperymentów naukowych Wyzwania 1/3 Wyzwania związane z zależnością od zewnętrznych zasobów» Zmiany w zewnętrznych zasobach» Różne wyniki w różnych momentach» Błędy w działaniu» Starzenie się (ang. decay) eksperymenty cyfrowe z czasem mogą przestać działać lub działać inaczej w wyniku zmian w zasobach zewnętrznych zarządzanych przez strony trzecie. Proces ten w mniejszym stopniu dotyczy także zależności od zasobów lokalnych. 5

Przechowywanie eksperymentów naukowych Wyzwania 2/3 Wyzwania związane z cyklem życia obiektów Kristina Hettne» Cyfrowy eksperyment przechodzi przez różne fazy, jego struktura podlega ciągłym zmianom.» Może być tworzony przez więcej niż jedną osobę autor, współpracownik, recenzent, promotor, itp. 6

Przechowywanie eksperymentów naukowych Wyzwania 3/3 Wyzwania związane ze złożoną strukturą obiektów Naukowcy Hipoteza Obiekt badawczy Eksperymenty Anotacje Dokumenty elektroniczne Historia Dane Wyniki 7

Obiekt badawczy jest jak klepsydra Protokoły i usługi specyficzne dla aplikacji Protokoły i usługi wizualizacji, publikacji Historia, wersjonowanie, profile Specyfikacja struktury Usługi wymiany danych (zależne od medium) Usługi przechowywania (zależne od medium)

Obiekty badawcze Struktura Podstawowa struktura jest opisana przez słowniki opisujące agregacje oraz anotacje http://wf4ever.github.com/ro/ 9 9

Obiekty badawcze Struktura Wyniki Workflow_16 Zawarte w Generuje QTL Logi Metadane Generuje Jest wejście dla Jest częścią Zawarty w Jest częścią Opublikowany w Prezentacj e Generuje Opublikowane w Paper Common pathways Workflow_13 Wyniki Zrozumienie pochodzenia i znaczenia poszczególnych elementów obiektów badawczych jest kluczowe dla zrozumienia, porównania i analizy metod badawczych oraz możliwości weryfikacji poprawności całego eksperymentu 10

Obiekty badawcze Cykl życia Live RO Live RO Naukowiec Mój opiekun prosi o raport z bieżących prac Mój opiekun decyduje o publikacji eksperymentu Po ocenach, wersja finalna Nowy student kontynuuje eksperyment <<kopiuj>> <<kopiuj>> <<kopiuj, filtruj i monitoruj>> <<kopiuj>> <<versionof>> Naukowiec RO snapshot RO snapshot <<wersja>> Bibliotekarz/kurator Identyfikowany przez URI Częściowe metadane Częściowe monitorowanie Prywatny / wewnętrzny Identyfikowany przez URI Częściowe metadane Częściowe monitorowanie Prywatny / wewnętrzny Archived RO Identyfikowany przez URI Dobre metadane Pełne monitorowanie Publiczny 11

Usługi zbudowane wokół obiektów badawczych Projekt Wf4Ever Aplikacje końcowe RO-Enabled RO Portal RO Manager Tool Collaboration Spheres Usługi zarządzania i analizy danych Checklist Evaluation Stability Evaluation Recommender Workflow Abstraction WF-RO Transformation Usługi przechowywania Usługi cyklu życia RO Digital Library RO Digital Library Workflow Runner 12

Research Object Digital Library Podgląd obiektu badawczego 13

Research Object Digital Library Wyszukiwanie obiektów badawczych 14

Checklist Evaluation Service Sprawdzanie jakości obiektu badawczego» Weryfikacja zgodności obiektu z przygotowanym profilem» Zarówno profile, jak i metadane obiektu badawczego są semantyczne, tj. łatwe do rozszerzania i aktualizowania 15

Decay Monitoring Service Monitorowanie jakości obiektu badawczego» Regularne monitorowanie jakości obiektów badawczych» Informacje o zmianach w obiektach oraz w zależnych zasobach» Powiadomienia użytkowników 16

Workflow Runner Service Uruchamianie workflowu jako usługa» Możliwość uruchomienia workflowu na serwerze» Wyniki i dane tymczasowe udostępniane na serwerze» Opis przebiegu wykonania zapisany w postaci metadanych semantycznych 17

Workflow Abstraction Service Analiza statystyczna workflowów oraz rekomendacje» Usługa przeszukuje zapisy wykonania workflowów i analizuje występowanie sekwencji tych samych elementów» Pozwala proponować kolejne kroki przy budowaniu workflowów 18

Obiekty badawcze w praktyce Demo http://sandbox.wf4ever-project.org/portal 19

Podsumowanie Dotychczasowe rezultaty i plany na przyszłość» Obiekty badawcze stanowią model specyfikacji złożonych, dynamicznych obiektów cyfrowych, w szczególności eksperymentów naukowych» Modele obiektów badawczych już w tej chwili są przedmiotem standaryzacji (W3C, Open Annotation Data Model) oraz analiz ze strony projektów badawczych (myexperiment, BioVel, ) oraz komercyjnych (GigaScience, Dryad, )» Usługi Wf4Ever demonstrują korzyści wynikające ze stosowania ustandaryzowanych modeli metadanych semantycznych» Wsparcie dla obiektów badawczych będzie stopniowo dodawane do istniejących usług PCSS w zakresie przechowywania i publikowania obiektów cyfrowych» W oparciu o dotychczasowe doświadczenia ze współpracy z biologami i astronomami, planujemy przechowywać i wspierać obiekty także z innych dziedzin zapraszamy do współpracy! 20

Pytania? piotrhol@man.poznan.pl http://www.wf4ever-project.org/ http://www.man.poznan.pl/

Podziękowania Zespół Wf4Ever EU Wf4Ever project (270129) funded under EU FP7 (ICT- 2009.4.1). (http://www.wf4ever-project.org) 22