7 r. Hutik Wiadomości hutice S. 79 7. Daccŕ A., Gemme G., Mattea L., Parodi R.: XPS aalsis of the surface compositio of iobium for supercoductig RF cavities, Appl. Surf. Sci., vol. 6, 99, s. 9. Atoie C. Z., Aspart A., Berthelot M., Gasser Y., Poupeau J. P., Vali F.: Morphological ad chemical studies of b samples after various surface treatmets, Proc. 9th Workshop o RF- Supercoductivit SRF999, 999, Sata Fe, USA, UP5 9. Ma Q., Roseberg R. A.: Surface stud of iobium samples used i supercoductig RF cavit productio, Proc. Particle Accelerator Coferece PAC, Chicago, USA, s. 5. Halbritter J.: Material sciece of b RF accelerator cavities: where we stad?, Proc. th Workshop o RF- Supercoductivit SRF,, SRF, sukuba, Japa, MAO6. Atoie C., Aspart A., Regault S.: Surface studies: method of aalsis ad results, Proc. th Workshop o RF- Supercoductivit SRF,, sukuba, Japa, MA7. Kowalski K., Berasik A., Siger W., Siger X., Camra J.: I situ XPS ivestigatio of the bakig effect o the surface oide structure formed o iobium sheets used i supercoductig RF cavit productio, Proc. th Workshop o RF-Supercoductivit SRF,, Lübeck-ravemüde, Germa, hp9. Briggs D., M. Seah P. (Eds.): Practical Surface Aalsis, Volume Auger ad X-ra Spectroscop, Secod Editio, Joh Wile Sos, 99 4. Bieveuti C., Calatroi S., Ruiov V.: Diffusio of oge i iobium durig bake-out, Proc. th Workshop o RF-Supercoductivit SRF,, sukuba, Japa, PR5 Mgr iż. OMASZ DĘBIŃSKI UKD 59.6:669-97..6.77..57 Mgr iż. DARIUSZ JĘDRZEJCZYK Dr hab. iż. MIROSŁAW GŁOWACKI, prof. AGH Akademia Górico-Hutica w Krakowie e-mail: tdebisk@metal.agh.edu.pl Algortm obliceń rówoległch dla prestreego modelu mia temperatur w procesie walcowaia Parallel computig algorithm for three-dimesioal thermal model of rollig process W artkule predstawioo problem prgotowaia do smulacji procesu walcowaia pasma e strefą półciekłą. Ze wględu a koiecość uskaia wików dużą dokładością w krótkim casie, wkorstao algortm obliceń rówoległch w celu dekompocji i astępującego po im rowiąaia powstałego układu rówań. Opracowa model matematc opart a metodie elemetów skońcoch dostarca iformacji o procesie. Model sekwecj procesu ostał aimplemetowa w techice obiektowo orietowaej. Ropatrwa ośrodek ciągł jest iejedorod e wględu a istiejące obsar półciekłe. Ab wiki odwierciedlał recwistość w sposób adowalając, iebęde jest uskaie wstarcająco dużej dokładości obliceń, co wiąże się koiecością geerowaia gęstej siatki elemetów skońcoch. ależ też auważć, że model ciepl jest tlko jedm modeli składowch procesu walcowaia. Ostatecie w końcowm etapie powstaje koiecość rowiąwaia dużch układów rówań liiowch. Ze wględu a ograicoą ilość pamięci operacjej komputerów, obliceia bardo dużą dokładością mogą okaać się iemożliwe do wkoaia lub cas potreb a uskaie wików będie bt długi, ab model miał aceie praktce. Problem jest automatcie rowiąa, gd do obliceń stosuje się algortm preacoe do obliceń użciem superkomputerów lub klastrów opartch a dużej licbie komputerów połącoch sbką siecią. Drugie rowiąaie jest seroko stosowae e wględów ekoomicch, jak rówież e wględu a uskiwae moce obliceiowe. Jedą seroko stosowach techologii dla klastrów jest iterfejs presłaia komuikatów MPI. Wkorstując tę techologię moża opracować algortm rówoległ smulacji walcowaia stali e strefą półciekłą. Moża tego dokoać popre rówoległe rowiąwaie wikowch układów rówań, jak rówież popre dekompocję sieci elemetów skońcoch i prdieleie podobsarów dostępm procesorom. he paper deals with computer simulatio of rollig process with mush oe. Due to reuiremet of high precisio results i short time a applicatio of parallel computig algorithm has bee cosidered i aim to carr out the decompositio ad subseuet solutio of resultig euatio sstem. he mathematical model worked out o the basis of fiite elemet method is able to give iformatio cocerig the phsical process. he seuetial model was implemeted i object orieted techiue. he cosidered phsical cotiuum is ihomogeeous due to eistece of mush regios. hus, the sufficietl precise computatio accurac is reuired i aim to achieve acceptable realit. It results i ecessit of geeratio of dese fiite elemet mesh. Oe ca state that the thermal model is ol oe of a umber of compoet models of rollig process. As a fial effect a solutio of huge liear sstem is reuired. akig ito cosideratio computer memor limits, a ver accurate computatio ca be impossible or the computatio time growths to be to log for practical applicatio of the model. he problem is usuall solved whe the parallel algorithm is developed for supercomputers or clusters cosistig of big umber of computers workig i high-speed etwork. he secod solutio is widel applied for the ecoomical reaso as well as the etwork capacit. Oe of the widel used techolog for computer clusters is MPI (message passig iterface). akig advatage of that techolog oe ca developed a parallel algorithm of simulatio of rollig of steel with mush oe. It is possible b parallel solutio of resultig euatio sstem as well as b decompositio of mesh of elemets ad distributio subregios to available processor.
S. Hutik Wiadomości hutice r 4 Słowa klucowe: walcowaie, strefa półciekła, model termic, obliceia rówoległe Kewords: rollig, mush oe, thermal model, parallel computig. Wstęp. Prewodeie ciepła roważae jest w określom obsare ciała. Każdemu puktowi ciała moża prpisać pewą temperaturę. Zbiór wartości temperatur we wsstkich puktach ropatrwaego ciała w tm samm casie jest awa polem temperatur. W ależości od licb współrędch prestrei, w kieruku którch mieia się temperatura, pole temperatur jest jedo-, dwulub trójwmiarowe []. Model fic prewodeia ciepła w ciałach stałch określo jest pre prawo łącące gęstość strumieia ciepła gradietem temperatur, postać różickowego rówaia bilasu eergii i rodajów waruków jedoacości jego rowiąaia. a ogół wstarcające jest posługiwaie się prawem Fouriera [6] dla gęstości strumieia ciepła, a tlko w iektórch prpadkach koiece jest uwględieie dodatkowch parametrów. Podstaw teoretce rówaia bilasu eergii są bardo robudowae. ależ określić, c w prewodeiu ciepła jest uwględia cas, c też ie jest. Mam wted odpowiedio do cieia ieustalom i ustalom prewodeiem ciepła. Dodatkowo ależ ropatrć, w ilu wmiarach astępuje prewodeie ciepła ora własości termofice substacji, które mogą bć prjęte jako stałe lub miee. W prpadku miech własości ależ uwględić ich mieość w modelu termicm. Poadto ależ ropatrć wstępowaie lub też brak wewętrch źródeł ciepła, jak rówież waruki bregowe modelu. ależ określić form jawisk wmia ciepła a powierchiach ewętrch ropatrwaego ciała. Opracowaie modelu matematcego każdego procesu preróbki plastcej ie może bć pobawioe cęści określającej wmiaę ciepła pomięd odkstałcam ciałem a otoceiem, jak rówież odkstałcającm je arędiem. Dotc to arówo procesów preprowadach w iskich temperaturach, cli tw. preróbki plastcej a imo, jak rówież tej wkowaej w wsokich temperaturach. Predstawia model jest opracowa dla ekstrawsokich temperatur, dlatego też bardo ważm elemetem podstaw matematcch procesu jest uupełieie go o model termic wmia ciepła, uwględiając mieą gęstość metalu.. Prestre termic model walcowaia opis modelu matematcego. Model matematc ropatrwaego jawiska polega a matematcm sformułowaiu prawa prewodeia ciepła, rówaia różickowego bilasu eergii ora waruków jedoacości rowiąaia [5]. Predstawiae tutaj rowiąaie modelu termicego jest w pełi prestrem prpadkiem modelu matematcego. Ropatrwa model jest opart o rówaie prewodeia ciepła Fouriera, które w ajogóliejsm prpadku moża predstawić w postaci: grad lub w postaci skalarej gdie: () () gęstość strumieia ciepła, W, m współcik prewodeia W ciepła (prewodość ciepla), m K, temperatura, [K], wektor abla (operator Hamiltoa), pochoda temperatur w kieruku prostopadłm do powierchi iotermicej, [K/m]. Zmiaa temperatur charakterowaa pre gradiet temperatur jest ajwięksa w kieruku prostopadłm do powierchi iotermicej. Gradiet temperatur jest wektorem. Biorąc pod uwagę, że rowiąaie jest preprowadae w kartejańskim układie współrędch, to gradiet temperatur moża apisać astępująco: l () l l gdie: l, l, l składowe wektora jedostkowego kieruku prepłwu ciepła, Współcik prewodeia ciepła dla ciał iotropowch jest skalarem, atomiast dla ciał aiotropowch jest tesorem smetrcm drugiego rędu. Dlatego też prawo Fouriera () w prpadku ciał aiotropowch jest dae rówaiem: Λ gdie: Λ tesor smetrc drugiego stopia postaci Λ (4) Dla układu współrędch kartejańskich współręde wektora gęstości strumieia ciepła są określoe pre astępujące rówaia: (5)
7 r. Hutik Wiadomości hutice S. Rs. Kstałt elemetu w globalm (a) i lokalm (b) układie współrędm Fig. Elemet shape i global (a) ad local (b) coordiate sstem Moża wkaać [4], że awse da się wacć tr wajemie prostopadłe kieruki w prestrei takie, że ij dla i j ora ij dla i j. Wspomiae kieruki awają się kierukami główmi ciała aiotropowego. W momecie, gd kieruki główe są rówoległe do osi prjętego układu współrędch tesor prewodości cieplej uprasca się do postaci Λ (6) α współcik wmia ciepła, strumień ciepl, macier fukcji kstałtu, wektor wartości węłowch temperatur, Wkorstaie globalego układu współrędch () do obliceń metodą elemetów skońcoch (MES) ie jest możliwe e wględu a charakterstkę samej metod. Po dskretacji obsaru elemet mogą mieć bardo łożo kstałt, pre co sereg wkoach całkowań arówo po powierchi jak rówież po objętości elemetu siatki jest bardo skomplikowae. Dlatego też ależ wprowadić lokal układ współrędch (), w którm elemet ostaje prekstałco do seściau o bokach rówch. atomiast współręde wektora gęstości strumieia ciepła są określoe rówaiami:,, (7) Ogóla postać rówaia Fouriera prbiera w takim układie postać: Q (). Rowiąaie stacjoare wmia ciepła oparte a podejściu wariacjm. Puktem wjścia do waceia pola temperatur w ciele stałm jest rówaie różickowe prewodeia ciepła (). Dskretacja rówaia metodą elemetów skońcoch prowadi do układu rówań liiowch postaci: H p (9) Rs. rójwmiarow widok ¼ cęści sieci elemetów Fig. hree-dimesioal view of ¼ part of elemet mesh ( α ) ds p S V Q dv () H V dv α ds S () Rs.. Prkładowa dekompocja blokowa adaia dla macier H ( ), wektorów i p dla 4 procesorów Fig.. Eemplar block decompositio for matri H ( ), vectors ad p for 4 processors
S. Hutik Wiadomości hutice r 4 W lokalm układie elemet posiada ieależą od całej siatki umerację węłów. Rówaie () powala a połąceie globalego układu współrędch układem lokalm: L L L () W rówaiu () i, i,,, są fukcjami kstałtu atomiast,,,,,,,, ora,,, są odpowiedio współrędmi węłów elemetu w globalm układie współrędch. Ab możliwa bła miaa układu współrędch ależ wacć jakobia trasformacji, będąc wacikiem macier Jakobiego J prekstałceia (), która składa się pochodch współrędch globalch wględem współrędch układu lokalego. J () Dla prkładu rówaie (4) predstawia rowi- ięcie pochodej. L (4) Prjmując prestree elemet rodi serepidowskiej o węłach fukcje kstałtu moża apisać astępująco: [ ( )( )( ) ] M (5) [ ( )( )( ) ] Po określeiu fukcji kstałtu dla elemetu ależ wacć pochode fukcji kstałtu po wsstkich kierukach (). Prkładowo pochode wględem pierwsej e współrędch prjmą postać [ ( )( ) ] M (6) [ ( )( ) ] Aalogicie ależ wacć poostałe pochode wchodące w skład elemetów macier trasformacji. Predstawioe podejście umożliwia lokale podejście do rowiąaia rówaia Fouriera, w którm rówaie () może bć powodeiem stosowae. Po obliceiu macier prekstałceń moża dokoać trasformacji układu (9) i oblicć macier H ora wektor p. Ostatim etapem rowiąaia jest obliceie układu rówań liiowch, po waceiu którego otrmujem rokład temperatur w paśmie. 4. Wkorstaie obliceń roprosoch. Zastosowaie metod elemetów skońcoch do rowiąwaia problemów wmia ciepła, jak i odkstałceia plastcego metali, prowadi do problemu rowiąaia dużch układów rówań wieloma iewiadommi. Rowiąwaie powstałego układu rówań (9) jest ajbardiej casochłom etapem obliceń. W celu miimaliowaia akładów casowch stosuje się sereg metod obliceiowch powalającch ograicć arówo łożoość pamięciową jak i obliceiową adaia. Skróceie casu obliceń uskuje się międ imi popre ograiceie operacji wkowach a erowch elemetach macier H. Wkorstuje się pr tm charakterstki macier stwości powalającch a astosowaie tw. pasmowego apisu macier lub form skompresowaej wiersami lub kolumami. Metodę rowiąwaia układu rówań dobiera się w ależości od łożoości obliceiowej adaia jak i samej metod, posiadach asobów pamięciowch ora bieżości algortmu. W wiąku tm stosowae są metod dokłade charakterujące się stałm casem obliceiowm, powalające uskać rowiąaie dokłade lub metod iteracje, którch cas wkowaia uależio jest od własości macier stwości. W iiejsej prac astosowao algortm schroicego rowiąwaia powstałego układu rówań liiowch. Charakterują się oe tm, że adaie posiada pewe rogałęieia, które mogą bć wkowae rówolegle [7]. Obliceia dla apropoowaej termicej cęści modelu walcowaia pasma e strefą półciekłą wkoao a klastre opartm a homogeicej sieci stacji robocch. Sieć elemetów dla ropatrwaego agadieia predstawia rs.. a b l i c a. Parametr siatek wkorstach do obliceń a b l e. Parameters of mesh implemeted for computig Strefa Strefa Strefa Cała siatka licba węłów Siatka Siatka 7 44 7 496 a b l i c a. Zestawieie testów wdajościowch a b l e. Cofiguratio of performace tests r testu Metoda p testu Ilość węłów est Gauss A est Gauss B est Gauss A 496 est 4 Gauss B 496 est 5 Gauss-Jorda A est 6 Gauss-Jorda B est 7 Gauss-Jorda A 496 est Gauss-Jorda B 496
7 r. Hutik Wiadomości hutice S. Pojedce węł klastra wposażoe bł w procesor klas AMD AHLO 64, 4 MB pamięci operacjej ora GB prestrei dskowej. Klaster opart ostał a komputerach wposażoch w sstemie operacjm liu SUSE, w kofiguracji bedskowej. Do komuikacji międwęłowej wkorstao sieć etheret o prepustowości Mb/s, ora środowisko MPICH w wersji -..5, bardo cęsto wkorstwae do presłaia komuikatów ora kompilator gcc []. Zastosowao dwie dokłade metod rowiąwaia układu rówań. Rówoległe metod: elimiacji Gaussa ora elimiacji Gaussa-Jordaa. Metoda elimiacji Gaussa polega a sprowadeiu układu A b do układu U b, gdie U jest górą macierą trójkątą. Ostatece rowiąaie uskuje się wkorstując podstawieie wstece (backward substitutio). Pr metodie tej moża wkorstać dwa proces elimiacji, elimiację w pród (forward elimiatio), która wmaga wkoaia O() operacji a O() dach, ora podstawieie wstece wmagające O() operacji a O() dach. Algortm rówoległ metod elimiacji Gaussa- -Jordaa wkowa a komputere rówoległm bądź klastre jest bardiej wdaj od algortmu elimiacji Gaussa, w preciwieństwie do realiacji sekwecjej, dla której algortm Gaussa-Jordaa wmaga więksego akładu obliceiowego. Metoda ta powala a rowiąaie be potreb stosowaia podstawieia wstecego. Dięki połąceiu fa elimiacji w tł i w pród uskuje się więkse iaro obliceń, co świadc o jego lepsej prdatości do obliceń rówoległch. Rs. 4. Wkres charakterstki casowej dla testu oacoego jako A Fig. 4. ime profile for A tests Rs. 5. Wkres charakterstki efektwościowej dla testu oacoego jako A Fig. 5. Efficiec profile for A tests
S. 4 Hutik Wiadomości hutice r 4 W praktce moża wkorstać wiele metod dekompocji adaia [9]. Biorąc pod uwagę charakterstkę macier H ora charakterstkę mas roprosoej astosowao metodę dstrbucji dach opartch a dekompocji blokowej (rs. ). Metoda polega oa a rówomierm podiale macier (prdieleie jedakowej licb sąsiadującch e sobą wiers) poscególm procesorom. sie _ of _ matri part (7) umber _ of _ processors gdie: part licba wiers prpadająca a jede procesor, sie_of_matri romiar macier, umber_of_processors licba mas w klastre. W prpadku wstąpieia wiers admiarowch koiece jest określeie ich licb, a astępie prdieleie part wiers do pocątkowch procesorów. Obliceia wkoao dla dwóch sieci o różej licbie elemetów, dla stref pred walcem, w strefie odkstałceia (pod walcem), ora w strefie chłodeia po walcowaiu (tablica ). Rs. 6. Wkres charakterstki prspieseia dla testu oacoego jako A Fig. 6. Acceleratio profile for A tests Rs. 7. Wkres charakterstki casowej dla testu oacoego jako B Fig. 7. ime profile for B tests
7 r. Hutik Wiadomości hutice S. 5 W celu więkseia dokładości pomiarów ora welimiowaia ewetualch akłóceń wsstkie pomiar wkowao trkrotie. W celu określeia efektwości obliceń ora prspieseia wględego wkoao sereg testów. Parametr wacoo opierając się a astępującch wskaźikach: Prspieseie wględe: t S p () t p gdie: t cas wkowaia programu a jedm procesore, t p cas wkowaia programu a p procesorach, gdie: S p prspieseie wględe, p licba procesorów. est obliceiowe preprowadoo dla astępującch prpadków: A. Stała licba jedostek obliceiowch, pr mieej licbie procesów (maksmala licba procesów ie prekraca licb jedostek obliceiowch). B. Stała licba procesów, więksająca się licba jedostek obliceiowch (licba procesów rówa maksmalej licbie jedostek obliceiowch). Zestawieie parametrów wkoach testów umercch predstawioo w tablic. Efektwość: S E p p p (9) Ze wględu a dużą licbę wkoach testów, estaw wików (cas obliceń, prspieseie wględe ora efektwość) predstawioo w postaci graficej a rs. 4 9. Rs.. Wkres charakterstki efektwościowej dla testu oacoego jako B Fig.. Efficiec profile for B tests Rs. 9. Wkres charakterstki prspieseia dla testu oacoego jako B Fig. 9. Acceleratio profile for B tests
S. 6 Hutik Wiadomości hutice r 4 Uskae reultat, predstawioe a rs. 4 6, uwidaciają silą ależość prspieseia obliceń od licb astosowach procesorów. ajlepse reultat uskuje się stosując licbę siedmiu procesorów w klastre, powżej tej wartości arówo prspieseie wględe, jak i efektwość, wkaują tedecję spadkową. Podobe wiki uskao dla prpadków oacoch jako B (rs. 7 9). m raem ajkorstiejsą wdaje się bć licba 9 procesorów. Brak wrostu wdajości dla więksej licb procesorów jest spowodowaa bt dużm rodrobieiem adaia obliceiowego, co w reultacie powoduje duże akład casowe a presłaie iformacji koiecch do schroiacji obliceń. 5. Podsumowaie. Wmieioe algortm rówoległe rowiąwaia układów rówań liiowch charakterują się dużą wdajością dla dużch układów rówań. Dla takich prpadków cas potreb a komuikację w stosuku do casu rowiąaia problemu jest proporcjoalie miejs i w miejsm stopiu wpłwa a wdajość. ależ jedoceśie auważć, że wmieioe algortm są bardo podate a wstępowaie błędów umercch spowodowach odworowaiem licb w pamięci komputera ograicoą dokładością. Efekt te jest pogłębia charakterstką algortmów. Uskae wiki obliceń świadcą o dużej skalowalości arówo algortmu elimiacji Gaussa jak i Gaussa-Jordaa. Prspieseie wględe wrasta dla więksającej się licb procesorów. Dla testów tpu A ora B algortm elimiacji Gaussa-Jordaa wkauje więkse prspieseie wględe ora więksą efektwość. Dla testów tpu B moża aobserwować gorse reultat dla wsstkich wskaźików dla obu algortmów, co świadc o gorsej skalowalości. Porówaie testów A i B uwidocia becelowość stosowaia bt dużej licb procesów w klastre o ograicoej licbie jedostek obliceiowch. ajlepse reultat uskuje się, gd licba procesów jest bliżoa do licb komputerów w klastre. Prspieseie programu stabiliuje się pr astosowaiu do ok. węłów klastra, dalse więksaie licb mas ie więksa w sposób istot wdajości, jest to spowodowae więksającm się arutem casowm a komuikację. Ze wględu a pasmowość ora smetrcość uskiwach macier podcas rowiąwaia problemów metodą elemetów skońcoch, asade jest stosowaie metod iteracjch o dużej bieżości. akie podejście powala a rowiąwaie adań o więksm apotrebowaiu a pamięć ora powala miejsć w sposób istot cas komuikacji międ węłami klastra. Uwaga. Praca wkoaa w ramach badań własch umowa AGH r...77 L i t e r a t u r a. Kostowski E.: Prepłw ciepła, Wdawictwo Politechiki Śląskiej, Gliwice. Maliowski Zb.: umerce modele w preróbce plastcej i wmiaie ciepła, Uceliae Wdawictwa aukowo- -Ddaktce, Kraków 5. Praca bior. pod red. Sargut J.: Modelowaie umerce pól temperatur, W, Warsawa 99 4. aler J., Duda P.: Rowiąwaie prostch i odwrotch agadień prewodeia ciepła, W, Warsawa 5. Wiśiewski S., Wiśiewski. S.: Wmiaa ciepła, W, Wd. IV, Warsawa 997 6. Fourier J. B.: héorie aaltiue de la chaleur, Paris 7. Kabrowski A.: Obliceia rówoległe i roprosoe, Warsawa. Kariadakis G., Kirb R.: Parallel Scietific Computig i C ad MPI, Cambridge Uiversit Press 9. Wasilewski M.: Project: Parallel Gaussia Elimiatio, Uiversit of Waterloo, 4 Zaprasam do reklamowaia swoich wrobów a asch łamach Redakcja Hutika Wiadomości hutice prjmuje odpłatie wselkie ogłoseia i iformacje a temat hutictwa żelaa, a więc wrobów i półwrobów, ich własości, waruków dostaw, a także o orgaiowaiu arad, smpojów i jadów. Podajem as adres: Redakcja casopisma Hutik Wiadomości Hutice, 4-9 Katowice ul. Krasińskiego, tel./fa (-prefi) 56-7-77