Paralelní implementace a optimalizace metody BDDC

Podobne dokumenty
Numerické metody minimalizace

Numerické metody 8. května FJFI ČVUT v Praze

Anna Kratochvílová Anna Kratochvílová (FJFI ČVUT) PDR ve zpracování obrazu / 17

SYSTEMY OPERACYJNE WYKŁAD 1 INTEGRACJA ZE SPRZĘTEM


Lineární algebra - iterační metody

Geometrická nelinearita: úvod

Reprezentace dat. BI-PA1 Programování a Algoritmizace I. Ladislav Vagner

Energetické principy a variační metody ve stavební mechanice

Elementární funkce. Edita Pelantová. únor FJFI, ČVUT v Praze. katedra matematiky, FJFI, ČVUT v Praze

Obecná orientace (obvykle. Makroskopická anizotropie ( velmi mnoho kluzných rovin )

1 Soustava lineárních rovnic

TGH01 - Algoritmizace

MATEMATIKA 3 NUMERICKÉ METODY. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

TGH01 - Algoritmizace

Paralelizace numerických metod











Tvarová optimalizace pro 3D kontaktní problém







kontaktní modely (Winklerův, Pasternakův)

IEL Přechodové jevy, vedení

LPAR - logiczne partycjonowanie systemów

Periodický pohyb obecného oscilátoru ve dvou dimenzích

IB109 Návrh a implementace paralelních systémů

z geoinformatických dat

Teorie plasticity. Varianty teorie plasticity. Pružnoplastická matice tuhosti materiálu

Přehled aplikací matematického programovaní a

PA152,Implementace databázových systémů 2 / 25

Fakulta elektrotechnická. Paralelní algoritmus pro

Przygotowana przez: Konrada Błachnio Pawła Koniecznego Michała Lenarta

Aproximace funkcí 1,00 0,841 1,10 0,864 1,20 0,885. Body proložíme lomenou čarou.

Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Walidacja systemu ewms / cwms. Sopot

Komplexní analýza. Martin Bohata. Katedra matematiky FEL ČVUT v Praze Martin Bohata Komplexní analýza Mocninné řady 1 / 18

Univerzita Palackého v Olomouci

Automatové modely. Stefan Ratschan. Fakulta informačních technologíı. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Numerické metody a statistika

Zasady licencjonowania produktów bazodanowych ORACLE

Výzvy, které před matematiku staví

Grzegorz Jaśkiewicz Dariusz Stefański

Základní elektrotechnická terminologie,

Edita Pelantová, katedra matematiky / 16

DOPLŇKY PRO STAVBU DOPLNKY PRE STAVBU ELEMENTY DODATKOWE NÁVRH PLYNOVÉ VZPĚRY / NÁVRH PLYNOVEJ VZPERY / SPOSÓB DZIAŁANIA

heteroskedasticitě Radim Navrátil, Jana Jurečková Katedra pravděpodobnosti a matematické statistiky, MFF UK, Praha

Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) 3. listopadu Filip Železný (ČVUT) Vytěžování dat 3. listopadu / 1

GTS Shared Infrastructure (GSI)

Obsah. Zobrazení na osmistěn. 1 Zobrazení sféry po částech - obecné vlastnosti 2 Zobrazení na pravidelný konvexní mnohostěn

Wyniki testów PassMark

Necht je funkce f spojitá v intervalu a, b a má derivaci v (a, b). Pak existuje bod ξ (a, b) tak, že f(b) f(a) b a. Geometricky

Paradoxy geometrické pravděpodobnosti

Ústav teorie informace a automatizace. Tato prezentace je k dispozici na:

High Performance Computers in Cyfronet. Andrzej Oziębło Zakopane, marzec 2009

Jednostki BudŜetowe (wszystkie)

Lista weryfikowanych poprawek systemu operacyjnego: L.p. Poprawka Opis Kategoria Data instalacji

Stavový popis Stabilita spojitých systémů (K611MSAP) Katedra aplikované matematiky Fakulta dopravní ČVUT. čtvrtek 20. dubna 2006

Platforma pro analýzu, agregaci a vizualizaci otevřených dat souv

K SAMOSTATNÉ MODULOVÉ SCHODY MONTÁŽI. asta


ggplot2 Efektní vizualizace dat v prostředí jazyka R Martin Golasowski 8. prosince 2016

UPS MODUŁOWY kva modułowy UPS, do 400kVA


Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti


Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

í ś Ś ż ś ż ś ń Ś đ ś ś Ż ć ń í ć ś ń í ś ć Ą Ż ś ń ő Ż ő ć ś Ł ż Ż ő ś Ż Ż Ż ś Ż

Specyfikacja Wymagań Oprogramowania

Weryfikowana konfiguracja stanowiska roboczego: Sprzęt:

NÁVOD K POUŽITÍ KEZELÉSI KÉZIKÖNYV INSTRUKCJA OBSŁUGI NÁVOD NA POUŽÍVANIE. Česky. Magyar. Polski. Slovensky

Zaproszenie do składania ofert. Numer wewnętrzny zapytania ofertowego 02/10/2013

Matematická analýza II pro kombinované studium. Konzultace první a druhá. RNDr. Libuše Samková, Ph.D. pf.jcu.cz

5. a 12. prosince 2018


Populační algoritmy a jejich uplatnění pro segmentaci obrazu. Pavel Jedlička

Technika mikroprocesorowa. Linia rozwojowa procesorów firmy Intel w latach

IB047. Pavel Rychlý. 21. února

Podstawy architektury systemów z równoległością na poziomie wątków

Wymagania techniczne dla programów antywirusowych. Oprogramowanie dla serwerów i stacji roboczych będących w sieci - ilość 450 sztuk:



Zásuvný modul QGISu. QGIS plugin pro práci s katastrálními daty

Strona znajduje się w archiwum.


Kybernetika a umělá inteligence. Gerstnerova laboratoř katedra kybernetiky. Daniel Novák

SATURN Online UPS + DATA CENTER + URZĄDZENIA TELEKOMUNIKACYJNE + SYSTEMY MEDYCZNE + AUTOMATYKA NADZORCZA. Smart Energy Solution

Kristýna Kuncová. Matematika B2 18/19


Transkrypt:

Paralelní implementace a optimalizace metody BDDC J. Šístek, M. Čertíková, P. Burda, S. Pták, J. Novotný, A. Damašek, FS ČVUT, ÚT AVČR 22.1.2007 / SNA 2007

Osnova Metoda BDDC (Balancing Domain Decomposition with Constraints) Implementace a optimalizace programu Výsledky

Úloha na rozhraní Ku = f = Su I = g S - Schurův doplněk - součet lokálních Schurových doplňků: S = R i T S i R i, kde S i = K i II K i IO (K i OO ) 1 K i OI g = R i T g i, kde g i = f i I K i IO (K i OO ) 1 f i O

BDDC 2003 C.R.Dohrmann, J.Mandel BDDC jako Schwarzova aditivní metoda u I n+1 u I = (I W T 0 S 1 0 W 0S... W T k S 1 k W ks)(u I n u I ) rychlost konvergence: κ(m 1 S) const( 1 + log 2 (H/h) ) H... charakteristická velikost subdomény h... charakteristická velikost elementu při zachování stálého poměru H/h se nezhoršuje konvergence metody

oblast rozdělená na subdomény

hrubá úloha úlohy na subdoménách

hrubá úloha úlohy na subdoménách

hrubá úloha úlohy na subdoménách

Algoritmus BDDC 1. sestavení úlohy na rozhraní: eliminace vnitřních uzlů všech subdomén (přímý chod na každé subdoméně) 2. vyřešení úlohy na rozhraní metodou sdružených gradientů, BDDC jako předpodmiňovač v každé iteraci zpětné chody: Dirichletova úloha na každé subdoméně Neumannova úloha na každé subdoméně hrubá úloha 3. dopočítání hodnot řešení ve vnitřních uzlech subdomén (zpětný chod na každé subdoméně)

Cíle implementace multiplatformní řešič se snadnou přenositelností jazyk Fortran 77 paralelní počítače s distribuovanou pamětí knihovna MPI jednoduchost a srozumitelnost programu stejné dělení paměti na procesorech,... nezávislost úlohy na počtu dostupných procesorů umožnění případu nproc nsub maximální využití existujících ověřených procedur užití frontálního řešiče kompatibilita s existujícím inženýrským baĺıkem pro analýzy PMD vstupní a výstupní soubory, datové struktury

Paralelní počítače použité pro testování Hastrman: Compaq Alpha server ES 47, ÚT AVČR 4 procesory Alpha EV7 / 1000 MHz operační systém Tru64 UNIX, DEC MPI Lomond: Sun Fire server E15k, EPCC, Edinburgh, UK 52 procesorů UltraSPARC III Cu / 1.2 GHz operační systém Solaris, Sun MPI HPCx: cluster of IBM eserver 575 nodes, Daresbury, UK 2560 procesorů IBM POWER5 / 1.5 GHz operační systém IBM AIX, IBM MPI

Optimalizace - Vampir 9 procesorů, 4 subdomény na procesor

Optimalizace - Vampir 2 subdomény na procesor

Konstrukce náhrady jamky kyčelního kloubu 27 586 kvadratických elementů, 154 247 uzlů, 551 720 stupňů volnosti

Rozdělení na subdomény 32 subdomén, 1600 hrubých uzlů

Napětí Von Mises

Testy škálování Hastrman: sériový frontální algoritmus... 6:40 hod = 400 min počet procesorů 1 2 4 počet subdomén na procesor 32 16 8 celkový čas (minuty) 40 30 27 sériový frontální algoritmus: čas CPU const.n.m 2, kde N... počet neznámých M... horní odhad šířky fronty

Testy škálování, výsledek optimalizace Lomond: sériový frontální algoritmus... více než 36 hod počet procesorů 4 8 16 32 počet subdomén na procesor 8 4 2 1 celkový čas (minuty) 120 68 52 38 počet procesorů 5 9 17 32 počet subdomén na procesor 8 4 2 1 celkový čas (minuty) 113 66 45 33

Hr ı del s dra z kou 483 400 linea rnı ch elementu, 505 312 uzlu, 1 515 936 stupn u volnosti

Rozdělení na subdomény 512 subdomén, 10 000 hrubých uzlů

Deformovaná geometrie

Testy škálování Hastrman: sériový frontální algoritmus... 24:30 hod = 1 470 min HPCx: počet procesorů 16 32 64 počet subdomén na procesor 32 16 8 celkový čas (minuty) 130 87 72

Shrnutí Implementace BDDC byla prověřena na několika praktických úlohách může být efektivnější než frontální algoritmus i na jednom procesoru testována na nejrůznějších paralelních architekturách optimalizována z hlediska komunikace mezi procesory Nejbližší cíle obecnější volba hrubé úlohy lepší porozumění chování metody rozšíření na problémy nelineární pružnosti a mechaniky tekutin