MESco. Testy skalowalności obliczeń mechanicznych w oparciu o licencje HPC oraz kartę GPU nvidia Tesla c2075. Stanisław Wowra

Podobne dokumenty
WIDEOS O ER E WER E ÓW

Komputer HP 8000 w obudowie USFF (Ultra Small Form Factor)

Intel Core i5-3320m 2 x 2,60 GHz / 4 GB / 320 GB / DVD-RW / Windows 10 Pro

Komputer Dell Precision T1600 w obudowie Midi Tower (MT) Intel Xeon E x 3,30 GHz / 16 GB / 500 GB / DVD / Windows 7 Professional

1. Serwer. 2. Komputer desktop 9szt. Załącznik nr 1 do SIWZ

Komputer HP 8200 w obudowie SFF (Small Form Factor) Core i x 3,1 GHz / 0 GB / 0 GB / DVD / Windows 7 Professional

Komputer HP 800 G1 w obudowie SFF (Small Form Factor)

Komputer HP 6200 w obudowie SFF (Small Form Factor) Intel Core i x 3,1 GHz / 2 GB / 250 GB / DVD / Windows 7 Home Premium Refurbished

Komputer HP 8200 w obudowie SFF (Small Form Factor) Intel Pentium Dual-Core G620 2 x 2,6 GHz / 4 GB / 250 GB / DVD / Windows 7 Professional

Komputer HP Compaq 8000 Pro w obudowie SFF (Small Form Factor) Intel Core 2 Duo E x 3,0 GHz / 4 GB / 160 GB / DVD / Windows 7 Professinal

Komputer HP 8100 w obudowie SFF (Small Form Factor)

Komputer HP Compaq 6000 Pro w obudowie MT (Midi Tower) Intel Pentium Dual-Core E x 2,93 GHz / 4 GB / 250 GB / DVD-RW / Windows 7 Professinal

Komputer Dell Optiplex 780 w obudowie SFF (Small From Factor) Intel Core 2 Duo E x 2,93 GHz / 4 GB / 160 GB / DVD-RW / Windows 7 Professional

Komputer HP 8200 w obudowie USFF (Ultra Small Form Factor)

Komputer HP 6300 w obudowie SFF (Small Form Factor) Core i x 3,3 GHz / 4 GB / 500 GB / DVD / Windows 7 Professional

Intel Core i5-4200u 2 x 1,8 GHz / 8 GB / 128 GB SSD / Windows 10 Pro

Komputer HP Compaq 6000 Pro w obudowie SFF (Small Form Factor) Intel Pentium Dual-Core E x 2,7 GHz / 8 GB / 250 GB / DVD / Windows 7 Professinal

Komputer DELL 7020 w obudowie SFF (Small Form Factor)

Intel Core i5-3340m 2 x 2,7 GHz / 4 GB / 128 GB SSD / DVD / Windows 7 Professional

Komputer Dell Optiplex XE w obudowie DT (Desktop) Intel Core 2 Duo E x 2,8 GHz / 2 GB / 250 GB / DVD-RW / Windows 7 Professional

Komputer DELL 3020 w obudowie Tower. Intel Core i x 3,20 GHz / 4 GB / 500 GB / DVD-RW / Windows 10 Pro

Komputer HP 8200 w obudowie SFF (Small Form Factor) Core i QUAD 4 x 3,1 GHz / 4 GB / 160 GB SSD / DVD / Windows 7 Professional

Komputer Dell 780 w obudowie MT (Mini-Tower) Intel Core 2 Quad Q x 2,83 GHz / 4 GB / 250 GB / DVD-RW / Windows 7 Professional

Cyfronet w CTA. Andrzej Oziębło DKDM

Komputer Dell Optiplex 760 w obudowie SFF (Small Form Factor) Intel Core 2 Duo E x 3,0 GHz / 4 GB / 160 GB / DVD-RW / Windows COA

Komputer Dell Optiplex 780 w obudowie DT (Desktop Tower) Intel Core 2 Duo E x 2,93 GHz / 4 GB / 160 GB / DVD / Windows 7 Professional

Komputer Fujitsu E500 w obudowie SFF (Small Form Factor) CORE i x 3,1 GHz / 4 GB / 250 GB / DVD / Windows 7 Professional

Intel Core i5-4300u 2 x 1,9 GHz / 4 GB / 500 GB / Windows 7 Professional

Intel Core i5-2520m 2 x 2,5 GHz / 4 GB / 500 GB / DVD-RW / Windows 7 Professional

Komputer Lenovo ThinkStation E30 w obudowie Tower. Intel Xeon E QUAD 4 x 3,3 GHz / 4 GB / 500 GB / DVD-RW / Windows 7 Professional COA

Intel Core i5-3230m 2 x 2,6 GHz / 4 GB / 256 GB SSD / DVD / Windows 10 Professional

Intel Core i5-3360m 2 x 2,80 GHz / 4 GB / 320 GB / DVD-RW / Windows 7 Professional

Komputer Fujitsu E510 w obudowie SFF (Small Form Factor) Core i x 3,3 GHz / 4 GB / 320 GB / DVD / Windows 7 Professional

Komputer FUJITSU ESPRIMO E710 w obudowie SFF (Small Form Factor) Intel Core i x 3,2 GHz / 8 GB / 500 GB / Windows 7 Professional

Kinowa Biblioteka Filmowa KINOSERWER. KinoSerwer

Parametry techniczne. Testy

Komputer HP 6200 w obudowie Midi Tower (MT) Intel Pentium G850 2 x 2,9 GHz / 4 GB / 250 GB / DVD / Windows 7 Professional

Komputer VIPER i x4,2ghz 8GB GTX 1050TI 4GB 1TB USB 3.0

Opis przedmiotu zamówienia / Formularz Oferty Technicznej (dokument należy złożyć wraz z ofertą)

Komputer DELL Optiplex 790 w obudowie SFF (Small Form Factor)

Komputer Dell Optiplex 755 w obudowie DT (Desktop) Intel Pentium E x 2,0 GHz / 2 GB / 160 GB / DVD / Windows XP Professional

Lenovo ThinkCentre M92p Small Form Factor (SFF) Intel Core i x 3,2 GHz / 4 GB / 250 GB / DVD-RW / Windows 7 Professional

Komputer DELL Optiplex 7010 w obudowie DT (Desktop Tower) Intel Core i x 3,3 GHz / 4 GB / 500 GB / DVD / Windows 7 Professional

Komputer DELL Optiplex 990 w obudowie MT (Midi Tower) Intel Core i x 3,4 GHz / 8 GB / 500 GB / DVD-RW / Windows 7 Professional

Komputer HP 6300 w obudowie SFF (Small Form Factor) Intel Pentium G x 2,9 GHz / - / - / - / -

Komputer Dell 790 w obudowie DT (Desktop Tower) Intel Pentium Dual-Core G620 2 x 2,6 GHz / 4 GB / 250 GB / DVD-RW / Windows 7 Professional

9. Dostarczenie komponentów do upgradu komputerów renderujących zgodnie z wymaganiami opisanymi w punkcie 1.9

Komputer HP 8200 w obudowie SFF (Small Form Factor) do rozbudowy. Brak CPU / 0 GB / 0 GB / DVD / Windows 7 Professional COA

Intel Atom D510 2 x 1,66 GHz / 2 GB / 250 GB / Windows 7 Home Premium

Opis Przedmiotu Zamówienia

Projekt pn. Dostępna szkoła jest współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego

Komputer Dell Optiplex 780 w obudowie USFF (Ultra Small Form Factor)

Klaster obliczeniowy

Kinowa Biblioteka Filmowa KINOSERWER. KinoSerwer

ZAPYTANIE OFERTOWE NR 2/NCBR/2016

Intel Celeron G530 2 x 2,40 GHz / 2 GB / 500 GB / DVD-RW / Windows 7 Professional

1. Serwer rack typ 1 Liczba sztuk: 2

FORMULARZ OFERTY. W odpowiedzi na ogłoszenie o przetargu nieograniczonym na dostawę sprzętu komputerowego z oprogramowaniem i licencją.

nr Ot /03/PN/2015 Zleceniodawca...: Europejskie Centrum Remarketingu Sp. z o.o. ul. Lipowa 2, Komorniki 1 300,00 PLN netto

WYKAZ NOTEBOOKÓW I TABLETÓW W DOSTAWIE SUKCESYWNEJ

Test dysku Intel SSD DC S GB. Wpisany przez Mateusz Ponikowski Wtorek, 22 Październik :22

KATALOG WIDEOSERWERÓW

System 32-Bit 1: Microsoft Windows 7 Home Premium 2;, Professional, Ultimate, Enterprise Microsoft Windows 8/8.1, Pro, Enterprise 2;

Opis przedmiotu zamówienia

EDGE BASIC. Dane Techniczne

Załącznik nr 6- Uszczegółowienie przedmiotu zamówienia. Pakiet 1 (Warszawa ) Tabela 1. Ilość 1 sztuka

FER Częstochowa, r. ZMIANA SIWZ

1. Komputer przenośny nr 1 9 szt.

Zestawienie wymaganych parametrów technicznych dla Pakietu nr 1

DOTACJE NA INNOWACJE

1. Wprowadzenie Opis sytuacyjny Specyfikacja techniczna... 3

Architektury komputerów Architektury i wydajność. Tomasz Dziubich

DOTACJE NA INNOWACJE O G Ł O S Z E N I E

Komputer DELL Optiplex 7010 w obudowie DT (Desktop Tower) Intel Pentium G x 2,9 GHz / 4 GB / 250 GB / DVD-RW / Windows 7 Professional

Welcome to the waitless world. Inteligentna infrastruktura systemów Power S812LC i S822LC

Zalecenia dotyczące budowania infrastruktury sprzętowej systemu Comarch ERP XL Aktualizacja dokumentu:

Laboratorium Chmur obliczeniowych. Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz

DZIERŻAWA I KOLOKACJA SERWERÓW DEDYKOWANYCH

ZAPYTANIE OFERTOWE. Zamawiający. Przedmiot zapytania ofertowego. Warszawa, dnia r.

Dane Techniczne TH ALPLAST ADS-S25

ZAŁĄCZNIK NR 1 OPIS PRZEDMIOTU ZAMÓWIENIA SPECYFIKACJA ILOŚCIOWO-JAKOŚCIOWA Część I przedmiotu zamówienia. Cena jednostkowa netto (zł)

1. KOMPUTEROWA STACJA ROBOCZA - konfiguracja wzorcowa lub inny równoważny

CENTRALNA KOMISJA EGZAMINACYJNA

OPIS PRZEDMIOTU ZAMÓWIENIA

Informacja do wszystkich zainteresowanych Wykonawców

Komputer DELL Optiplex 3020 MT (Midi Tower) Intel Core i QUAD 4 x 3,4 GHz / 8 GB / 120 GB SSD / DVD-RW / Windows 10 Professional

Załącznik nr 6 do SIWZ. 1. Stacja robocza 46 szt. NAZWA PRODUCENTA: NUMER PRODUKTU (part number):

Opis Przedmiotu Zamówienia

SPECYFIKACJA PRZEDMIOTU ZAMÓWIENIA ZAPYTANIE OFERTOWE NR HBRP/0370/2017

Zasoby i usługi Wrocławskiego Centrum Sieciowo-Superkomputerowego

Tabela zgodności przedmiotu umowy oferowanego do dostawy

Szczegółowy opis przedmiotu zamówienia

Szczegółowy opis przedmiotu zamówienia na: Dostawa poleasingowych komputerów wraz z oprogramowaniem nr postępowania KE/ 01/ 12/ 18

DZIERŻAWA I KOLOKACJA SERWERÓW DEDYKOWANYCH

Serwer biznesowy o podwójnym zastosowaniu moc obliczeniowa i pamięć masowa w jednej obudowie

Warszawa, dnia 14 października 2015 r. Do Uczestników postępowania

nazwa producenta/ nr katalogowy/ okres gwarancji cena jedn.netto nazwa producenta/ nr katalogowy/ okres gwarancji cena jedn.netto

MODYFIKACJA. Nie otwierać przed 25 listopada 2013 r. godz

Komputer DELL Optiplex 9010 w obudowie MT (Midi Tower) Intel Core i QUAD 4 x 3,4 GHz / 8 GB / 500 GB / DVD-RW / Windows 7 Professional

OPIS PRZEDMIOTU ZAMÓWIENIA

Transkrypt:

MESco Testy skalowalności obliczeń mechanicznych w oparciu o licencje HPC oraz kartę GPU nvidia Tesla c2075 Stanisław Wowra swowra@mesco.com.pl

Lider w dziedzinie symulacji na rynku od 1994 roku. MESco 42-600 Tarnowskie Góry, ul.górnicza 20a tel. (+48 32) 768-36-36 fax: (+48 32) 768-36-35 E-mail info@mesco.com.pl http://www.mesco.com.pl 2

Testy przyspieszenia obliczeń mechanicznych przy wykorzystaniu licencji ANSYS HPC, HPC Pack oraz procesorów graficznych nvidia Tesla C2075 Celem testów było sprawdzenie zakresu skalowalności przyspieszenia obliczeń na rzeczywistym i złożonym modelu nieliniowym w analizie mechanicznej. W czasie testu nie porównywano różnych modeli mechanicznych. Do testów został wykorzystany model dostarczony przez firmę Avio Polska.

Parametry techniczne stacji roboczej Stacja HP z800 Procesory: 2 x Intel Xeon x5690 (3.46 GHz, 6 core) Pamięć: 96 GB DDR3 Dyski: 1 TB SATA 7200 Oprogramowanie System: Windows 7 64 bit ANSYS: v13 SP2 Procesor graficzny GPU nvidia Tesla C2075 (wersja certyfikowana dla stacji HP) 4

Parametry techniczne stacji roboczej 5

Model wykorzystany do testów Analiza mechaniczna Analiza: statyka nieliniowa Model: 1.3 mln węzłów Elementy kontaktowe: 26 tyś elementów typu 52 Solver: Sparse i PCG 6

Wprowadzenie W analizach mechanicznych istnieje możliwość prowadzenia obliczeń na 2 rdzeniach w wersji komercyjnej oraz na 4 w wersji uniwersyteckiej Prowadzenie obliczeń na większej ilości rdzeni jest możliwe poprzez dokupienie licencji HPC Prowadzenie obliczeń ze wsparciem GPU jest możliwe wraz z licencją HPC Pack (dla komercji) oraz standardowo w wersjach uniwersyteckich Kolejne slajdy pokazują zestawienie czasu obliczeń i przyspieszenia na 1, 2, 4, 6, 8, 10, 11 i 12 rdzeniach. 7

Wyniki dla analiz z HPC (ANSYS 13.2) Solver Typ Liczba rdzeni Czas [s] Czas [min] Redukcja czasu obliczeń Sparse In-Core 1 10122.5 168.71 1.00 - Sparse In-Core 2 5670.3 94.51 0.56 1.79 Sparse In-Core 4 3577.1 59.62 0.35 2.83 Sparse In-Core 6 2905.8 48.43 0.29 3.48 Sparse In-Core 8 2525.5 42.09 0.25 4.01 Sparse In-Core 10 2374.4 39.57 0.23 4.26 Sparse In-Core 11 2288.3 38.14 0.23 4.42 Sparse In-Core 12 2259.8 37.66 0.22 4.48 PCG In-Core 6 6430 107.17 0.64 1.57 PCG In-Core 12 7320 122.00 0.72 1.38 8

Wyniki dla analiz z HPC (ANSYS 13.2) 180.00 Z800 Y-[min] X-[CPU] 160.00 140.00 120.00 100.00 80.00 z800 SPARSE 60.00 40.00 20.00 0.00 1 2 3 4 5 6 7 8 9 10 11 12 9

Wyniki dla analiz z HPC + GPU Solver Typ Liczba rdzeni Czas [s] Czas [min] Redukcja czasu obliczeń Sparse + GPU In-Core 2 2043 34.05 0.20 4.95 Sparse + GPU In-Core 4 1776 29.60 0.18 5.70 Sparse + GPU In-Core 5 1704 28.40 0.17 5.94 Sparse + GPU In-Core 8 1674 27.90 0.17 6.05 Sparse + GPU In-Core 9 1650 27.50 0.16 6.13 Sparse + GPU In-Core 11 1599 26.65 0.16 6.33 Sparse + GPU In-Core 12 1658 27.63 0.16 6.11 10

Wyniki dla analiz z HPC + GPU 40.00 Z800 Y-[min] X-[CPU] 35.00 30.00 25.00 20.00 z800 + GPU 15.00 10.00 5.00 0.00 1 2 3 4 5 6 7 8 9 10 11 12 11

Porównanie z i bez GPU (czas obliczeń) 180.00 Z800 Y-[min] X-[CPU] 160.00 140.00 120.00 100.00 80.00 Z800 z800+gpu 60.00 40.00 20.00 0.00 1 2 3 4 5 6 7 8 9 10 11 12 12

Porównanie z i bez GPU (przyspieszenie) 7.00 Z800 Y-[speedup] X-[CPU] 6.00 5.00 4.00 3.00 z800 z800 + GPU 2.00 1.00 0.00 1 2 3 4 5 6 7 8 9 10 11 12 13

Przyspieszenie po dołożeniu GPU do HPC 3.00 2.50 2.00 1.50 GPU sppedup 1.00 0.50 0.00 2 3 4 5 6 7 8 9 10 11 12 Stosunek czasu obliczeń z GPU do bez GPU vs liczba rdzeni. 14

Wnioski Wersji 12.0 ANSYS znacznie ulepszył rozwiązania obliczeń rozproszonych dla analiz mechanicznych. W wersji 13 zostały wprowadzone kolejne zmiany i obecnie posiadamy bardzo dobre, i skalowalne narzędzie, pozwalające znacznie przyspieszyć obliczenia mechaniczne. Dodatkowo została wprowadzona możliwość wykorzystania do obliczeń GPU w postaci kart nvidia Tesla (w wersji beta także ATI) Wyniki benchmarku wskazują na znaczne przyspieszenie obliczeń przez licencje HPC co przekłada się na możliwość przeprowadzenia większej liczby analiz a tym samym zwiększenie wydajności narzędzi ANSYS. - 16 -

Wnioski Po analizie ekonomicznej kosztów licencji HPC oraz karty GPU vs koszt licencji mechanicznej (poziom Structural) uzyskano maksimum zysków w okolicach 8-9 rdzeni. Optymalnym rozwiązaniem jest wyposażenie swojego stanowiska w licencję HPC Pack (4 krotna redukcja czasu) oraz kartę nvidia Tesla c2075 (dodatkowa 50% redukcja czasu). * Duże znaczenie ma także taktowanie i klasa procesora. Przeprowadzono testy dla różnych procesorów z rodziny Xeon i w ekstremalnym przypadku uzyskano 10 krotną różnicę w czasie obliczeń. * Wyniki testu przyspieszenia uzyskano dla konkretnego, rzeczywistego modelu. W przypadkach indywidualnych wyniki mogą się różnic od przedstawionych. - 17 -

Wnioski Przy pełnym obciążeniu maszyny (12 rdzeni) widać nieznaczne spowolnienie w stosunku do obliczeń z 1 rdzeniem wolnym (11 rdzeniach). Jest to spowodowane przez procesy systemowe, które minimalnie obciążają maszynę, ale w efekcie wstrzymują obliczenia. Godne uwagi przyspieszenie zostało uzyskane pomiędzy obliczeniami outcore (poza pamięcią RAM) a in-core (cały model w pamięci). Sugeruje to rozbudowę stacji roboczej o odpowiednią do przeliczanych modeli ilość pamięci operacyjnej. W czasie testów zaobserwowano również wpływ fragmentacji danych na dysku na czas obliczeń. Przy dużej fragmentacji obliczenia przebiegały nieznacznie wolniej. - 18 -

Dziękuję. Pytania? 21