Skalowalna Platforma dla eksperymentów dużej skali typu Data Farming z wykorzystaniem środowisk organizacyjnie rozproszonych



Podobne dokumenty
Automatyzacja procesu tworzenia i zarządzania Wirtualnymi Organizacjami w oparciu o wiedzę w zastosowaniu do architektur zorientowanych na usługi

Nowe aplikacje i usługi w środowisku Grid

PLGrid: informatyczne usługi i narzędzia wsparcia w nauce

Cyfronet w CTA. Andrzej Oziębło DKDM

Infrastruktura PLGrid dla młodych naukowców

Parametry wydajnościowe systemów internetowych. Tomasz Rak, KIA

Architektury usług internetowych. Tomasz Boiński Mariusz Matuszek

Mateusz Kurleto NEOTERIC. Analiza projektu B2B Kielce, 18 października 2012

USŁUGI HIGH PERFORMANCE COMPUTING (HPC) DLA FIRM. Juliusz Pukacki,PCSS

Infrastruktura PLGrid Nowa jakość usług informatycznych dla Polskiej Nauki

Chmura obliczeniowa jako źródło dostępu do usług świadczonych na drodze elektronicznejd

Uslugi chmurowe dla nauki na podstawie BonFIRE

Projektowanie i implementacja wysokowydajnych aplikacji w języku

Wykorzystanie infrastruktury chmurowej i platformy GridSpace w obliczeniach naukowych

Klaster obliczeniowy

INTERNET - Wrocław Usługi bezpieczeństwa w rozproszonych strukturach obliczeniowych typu grid

Infrastruktura PLGrid Nowa jakość usług informatycznych w służbie nauki

1 Implementowanie i konfigurowanie infrastruktury wdraŝania systemu Windows... 1

Szczegółowy opis przedmiotu zamówienia:

Infrastruktura PLGrid Nowa jakość usług informatycznych w służbie nauki

Małopolska Chmura Edukacyjna Projekt pilotażowy MRPO, działanie 1.2

Integracja wirtualnego laboratorium z platformą e-learningową

Infrastruktura gridowa

Poznańskie Centrum Superkomputerowo-Sieciowe

Realizacja idei OpenADR dwukierunkowa komunikacja dostawcy energii-odbiorcy rozwój i implementacja niezbędnej infrastruktury systemowej i programowej

Infrastruktura PLGrid Nowa jakość usług informatycznych dla Polskiej Nauki

Usługi przechowywania danych KMD/PLATON-U4 dla bibliotek cyfrowych. Maciej Brzeźniak, Norbert Meyer, Rafał Mikołajczak, Maciej Stroiński

Bezpieczeństwo dla wszystkich środowisk wirtualnych

Architektura oraz testowanie systemu DIADEM Firewall Piotr Piotrowski

Model funkcjonowania MPTI

Piotr Bubacz Cloud Computing

Infrastruktura PLGrid

Zapewnienie dostępu do Chmury

Przetwarzanie danych w chmurze

Laboratorium przez Internet w modelu studiów inżynierskich

Infrastruktura PLGrid dla młodych polskich naukowców

Laboratorium Wirtualne

Budowa uniwersalnej architektury dla Laboratorium Wirtualnego

Sterowany jakością dostęp do usług składowania danych dla e-nauki

Szkolenie: Testowanie wydajności (Performance Testing)

Internet przedmiotów - opis przedmiotu

Kurs OPC S7. Spis treści. Dzień 1. I OPC motywacja, zakres zastosowań, podstawowe pojęcia dostępne specyfikacje (wersja 1501)

Dni: 3. Opis: Adresaci szkolenia

Usługa: Testowanie wydajności oprogramowania

Piotr Dziubecki Piotr Grabowski, Tomasz Kuczyński Tomasz Piontek, Dawid Szejnfeld, PCSS

Izabela Zimoch Zenon Szlęk Biuro Badań i Rozwoju Technologicznego. Katowice, dnia r.

Równoległe aplikacje duŝej skali w środowisku PL-Grid. Kick-off PL-GRID Kraków, kwietnia 2009

Wprowadzenie. Co to jest klaster? Podział ze względu na przeznaczenie. Architektury klastrów. Cechy dobrego klastra.

Na podstawie 6 ust. 1 oraz 10 ust. 1 Regulaminu Organizacyjnego ACK Cyfronet AGH z dnia 28 kwietnia 2005 roku zarządzam co następuje:

Usługi i narzędzia QCG

Nazwa jednostki Temat pracy (w języku polskim i angielskim) Rodzaj pracy Ilość osób realizujących pracę

ZAŁĄCZNIK NR 2.14 do zapytania ofertowego SCENARIUSZE TESTOWE

Model Matematyczny Call Center

platforma zapewniająca usługi wirtualizacji

Prezentacja wyników badania wykorzystania przetwarzania w chmurze w największych polskich przedsiębiorstwach

Projekt SGI. WP 3.1 Wirtualne laboratorium i teleimersja Jacek Cała. (cala@ics.agh.edu.pl) (luke@ics.agh.edu.pl) Łukasz Czekierda

Platforma serwerowa Microsoft - do usług. O wdrożeniu Microsoft Cloud Platform w Beyond.pl

Architektura komputerów

LANDINGI.COM. Case Study. Klient Landingi.com. Branża IT, marketing i PR. Okres realizacji od grudnia 2013 do chwili obecnej.

Przetwarzanie danych w chmurze

Virtual Grid Resource Management System with Virtualization Technology

Dane bezpieczne w chmurze

Chmura obliczeniowa nowej generacji. Maciej Kuźniar 26 listopada 2015

Prestige MJM Case Study

Definicja, rodzaje chmur obliczeniowych oraz poziomy usług

Wirtualizacja zasobów informatycznych w pracowni komputerowej

Stacja robocza TYP1A Zał. 8.1, pkt. 1.1) 2. Monitor LCD 21.3 Zał. 8.1, pkt. 1.1) 2. Zasilacz awaryjny UPS Zał. 8.1, pkt. 1.1) 2

Zasoby i usługi Wrocławskiego Centrum Sieciowo-Superkomputerowego

Bezpieczny dostęp do usług zarządzania danymi w systemie Laboratorium Wirtualnego

Dyrektor ACK Cyfronet AGH. z dnia 2 października 2017 roku w sprawie zmian organizacyjnych

Dr inż. Andrzej KAMIŃSKI Instytut Informatyki i Gospodarki Cyfrowej Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie

Informatyzacja JST z zastosowaniem technologii przetwarzania w chmurze

Zarządzanie informacją i wiedzą w usługach o podwyŝszonym poziomie bezpieczeństwa. Poznań,

Krzysztof Jąkalski Rafał Żmijewski Siemens Industry Software

Systemy Informatyki Przemysłowej

Środowisko InSilicoLab dla chemii obliczeniowej

Katedra Inzynierii Komputerowej Politechnika Częstochowska. Sieci przełączane Laboratorium Podstaw sieci komputerowych

Wirtualizacja. Metody, zastosowania, przykłady

Rozproszona biblioteka cyfrowa pacjenta w środowisku Prywatnej Sieci ezdrowie Rodziny

Oblicza konwergentnej infrastruktury czyli przypadki kiedy = 3

Materiał dystrybuowany na licencji CC-BY-SA

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje w roku akademickim 2011/2012. Programowanie usług sieciowych

GRIDY OBLICZENIOWE. Piotr Majkowski

Hadoop i Spark. Mariusz Rafało

Wykorzystanie wirtualnej platformy Laboratorium Technik Semantycznych LTS w nauce i dydaktyce

Koncepcja budowy Zintegrowanej Infrastruktury Teleinformatycznej dla Jednostek Kultury pn. Regionalna Platforma Informacyjna Kultura na Mazowszu

Bezpieczne miasto. koncepcja i rozwiązania w projekcie Mayday Euro 2012

Najlepsze praktyki w podejściu do rozbudowy infrastruktury Michał Stryga

Autorytatywne serwery DNS w technologii Anycast + IPv6 DNS NOVA. Dlaczego DNS jest tak ważny?

Laboratorium Wirtualne w środowisku gridowym

Chmura nad Smart City. dr hab. Prof. US Aleksandra Monarcha - Matlak

Szczególne problemy projektowania aplikacji internetowych. Jarosław Kuchta Projektowanie Aplikacji Internetowych

Wykorzystanie innowacyjnego programu komputerowego AnalizatorOZE do oceny bilansów energii w budynkach mieszkalnych

Katedra Inzynierii Komputerowej Politechnika Częstochowska. Sieci o topologii pierścienia Laboratorium Podstaw sieci komputerowych

Infrastruktura PLGrid Nowa jakość usług informatycznych dla Polskiej Nauki

Wirtualizacja zasobów IPv6 w projekcie IIP

Microsoft System Center Virtual Machine Manager 2012

Wyższy poziom bezpieczeństwa

Zadania PCSS w Polskiej Platformie Bezpieczeństwa Wewnętrznego

Projektowanie architektury systemu rozproszonego. Jarosław Kuchta Projektowanie Aplikacji Internetowych

Transkrypt:

1 Skalowalna Platforma dla eksperymentów dużej skali typu Data Farming z wykorzystaniem środowisk organizacyjnie rozproszonych D. Król, Ł. Dutka, J. Kitowski ACC Cyfronet AGH

Plan prezentacji 2 O nas Wprowadzenie do metodyki Data Farming Opis problemu Propozycja rozwiązania Przykłady zastosowania Kontakt

O nas 3 Grupa Systemów Komputerowych AGH http://www.icsr.agh.edu.pl/ Zespół Knowledge in Grids http://www.icsr.agh.edu.pl/index.php/knowledge-in-grids-team Bliska współpraca z ACK Cyfronet AGH

O nas tematyka badawcza 4 Wykorzystanie technologii semantycznych do wsparcia Wirtualnych Organizacji Framework for Intelligent Virtual Organizations Grid Organizational Memory X2R Systemy zarządzania danymi oraz systemy monitorujące wykorzystanie danych Service Level Agreement Monitoring QStorMan Systemy samo-skalowalne Scalarm

Metodyka Data Farming 5 1. Experiment objectives definition 2. Simulation scenario building 5. Output data exploration Infromation Store 3. Input space specification 4. Simulation execution

Typowy sposób prowadzenia eksperymentów 2. Stacja robocza lub klaster lokalny 3. Środowisko Gridowe 6 1. Komputer osobisty 4. Chmura obliczeniowa

Opis problemu 7 A co z tworzeniem przestrzeni parametrów? A co z niezawodnością? 2. Dostęp zdalny 3. Systemy - linia poleceń kolejkowe A co ze zbieraniem wyników? 1. Zintegrowane środowisko programistyczne 4. Dedykowane protokoły dostępu

Proponowane rozwiązanie 8 Przygotowanie eksperymentu Wykonanie symulacji

Problemy rozwiązywane przez platformę Scalarm 9 Eksploracyjne wykonywanie eksperymentów typu Data Farming Generowanie przestrzeni parametrów z wykorzystaniem metod projektowania eksperymentów, np. próbkowanie przestrzeni parametrów przy pomocy planowania frakcyjnego Wykorzystanie heterogenicznych infrastruktur obliczeniowych, w tym środowisk typu Cloud Efektywne wykorzystywanie zasobów obliczeniowych dzięki samo-skalowalności

Koncepcja architektury narzędzia Client part Client... Client Master part Manager... Manager Manager Worker part Worker Worker Worker... Worker Worker Worker Worker Worker Worker Infrastructure A Infrastructure B Infrastructure C

Scalarm zarządzanie zasobami Klient Klient Nowy eksperyment Nowy eksperyment Wolne zasoby Wykonywanie eksperymentu Zasoby platformy EM EM SM EM EM SM SM SM SM Zasoby obliczeniowe - worker node EM Experiment Manager SM Storage Manager simulation manager

Wsparcie dla środowisk obliczeniowych Infrastruktura prywatna SM EM EM EM EM EM Środowisko Gridowe Chmura obliczeniowa EM EM SM - worker node EM Experiment Manager SM Storage Manager simulation manager

Przykład użycia Kompletna platforma dla eksperymentów typu Data Farming 13

Schemat działania 14

Wykorzystanie metodyki Data Farming 15 Motywacja: Weryfikacja strategii postępowania służb wojskowych przy pomocy symulacji wielo-agentowych w wybranych scenariuszach Cele przeprowadzanych eksperymentów: Identyfikacja zależności pomiędzy parametrami wejściowymi symulacji a rezultatami eksperymentów Porównanie różnych strategii postępowań służb wojskowych Wybór wartości parametrów wejściowych dla sesji treningowych

Wykorzystanie platformy Scalarm 16

Przykład użycia Simulation-as-a-Service 17 Aplikacja natywna API Wykonywanie symulacji

Testy wydajności platformy 18 Cel: zbadanie skalowalności części zarządzającej platformy Wielkość eksperymentów [#symulacji]: 100 000, 200 000, 500 000, 1 000 000, 2 000 000 Zasoby obliczeniowe dla części zarządzającej [#serwerów]: 4, 8, 16 #Klientów: 120 * #serwerów Metryka: przepustowość mierzona w wykonanych pustych symulacjach w jednostce czasu

Przepustowość [ #symulacji / s ] Rezultat 19 600 500 4 serwery 8 serwerów 16 serwerów 400 300 200 100 0 1 2 5 10 20 50 Rozmiar eksperymentu [#symulacji * 100 000]

Dziękuję za uwagę 20 Kontakt -> dkrol@agh.edu.pl Strona platformy -> http://www.scalarm.com