Metoda dekompozycj obszaru dla quaslnowych elptycznych równań różnczkowych czastkowych Leszek Marcnkowsk Praca magsterska Serpeń 1994 Promotor: profesor Maksymlan Dryja Unwersytet Warszawsk Wydza l Matematyk, Informatyk Mechank Instytut Matematyk Stosowanej Mechank
2
1 Wst ep W pracy rozważamy równoleg le algorytmy rozwazywana uk ladów nelnowych równań algebracznych powsta lych z dyskretyzacj quaslnowych równań elptycznych metoda elementu skończonego. Iteracyjne metody welopozomowe należa do najbardzej efektywnych metod rozwazywana uk ladów równań zwazanych z dyskretyzacja równań różnczkowych czastkowych zob. [2, Bank, Rose]. W pracy uogólnamy welopozomowa metode rozważana w [7, 8, Dryja, Wdlund],[13, Zhang] dla lnowych równań elptycznych na zagadnena nelnowe. Celem pracy jest przedstawene dwóch metod oraz analza ch zbeżnośc; manowce perwszej powsta lej z uogólnena welopozomowej addytywnej metody Schwarza w po l aczenu z metoda Rchardsona oraz drugej powsta lej z metody Newtona z wewnetrznym zewnetrznym teracjam. Do wewnetrznych lnowych teracj użyjemy tu też addytywnej metody Schwarza. W analze pokażemy, że zbeżność obu metod ne zależy od lczby newadomych lczby pozomów. W perwszej metodze, Rchardsona, każda teracje można przeprowadzć równolegle a w drugej metodze, Newtona, wszystke teracje wewnetrzne można przeprowadzać równolegle. Perwszy algorytm jest rozszerzenem algorytmu powsta lego z dwupozomowej addytywnej metody Schwarza opsanej w referace [3, Ca, Dryja]. Obe metody sa optymalne, kedy rozpatuje se je jako równoleg le sekwencyjne. Jeżel rozpatrujemy obe metody jako równoleg le przy za lożenu, że mamy L procesorów, tyle le pozomów, to speedup czyl stosunek czasu wykonana algorytmu na L procesorach do czasu wykonana na jednym procesorze wynos L. Komunkacja synchronzacja sa też neduże koszt teracj jest rzedu lczby newadomych. Kedy rozpatrujemy obe metody, jako sekwencyjne to przy odpowednej mplementacj koszt jednej teracj też jest rzedu lośc newadomych. W rozdzale 2 przedstawmy zagadnene różnczkowe oraz za lożena przy których ma ono jednoznaczne rozwazane. Pokażemy też pewne w lasnośc tego zagadnena. W rozdzale 3 przedstawmy dyskretyzacje metoda elementu skończonego oraz pokażemy stnene rozwazana uk ladu równań powsta lych w wynku tej dyskretyzacj. Rozważymy tu przypadek dwuwymarowy aproksymacje na trójkatach kawa lkam lnowa cag l a. W tym rozdzale opszemy też pochodna Gateaux operatora dyskretnego. W rozdzale 4 opszemy welopozomowa metode Schwarza dla równana Possona oraz mplementacje precondtonera, który powstaje z tej metody. Paragraf ten ma charakter pomocnczy. W rozdzale 5 przedstawmy metode 1
Rchardsona w po l aczenu z precondtonerem z poprzednego rozdza lu wraz z analza zbeżnośc mplementacja. W rozdzale 6 przedstawmy metode Newtona z zewnetrznym wewnetrznym teracjam z zastosowanem precondtonera z rozdza lu 4, wraz z analza zbeżnośc porównaj [9, D yakonov]. Na konec w rozdzale 7 przedstawmy wynk klku numerycznych eksperymentów zwazanych z przedstawonym wcześnej algorytmam. Lczba teracj potrzebnych, aby b l ad resdualny by l mnejszy od b l edu poczatkowego pomnożonego przez ustalony czynnk np. (10 4 ) ne zależy od lczby newadomych pozomów potwerdzajac resultaty teoretyczne zawarte w pracy. 2
2 Zagadnene różnczkowe W tej cześc sformu lujemy zagadnene różnczkowe, którym se zajmujemy oraz przedstawmy pewne jego w lasnośc. Klasyczne sformu lowane problemu różnczkowego jest nastepuj ace: Lu = =1 x a (x, u, u) + a 0 (x, u, u) = f(x) x Ω R 2 (1) u(x) = 0 x Ω gdze u = ( x 1 u, x 2 u) T Bedze nas nteresowa lo s labe sformu lowane tego zagadnena. Wyznaczyć u H0(Ω) 1 take,że gdze a(u, v) = f(v) v H 1 0(Ω), (2) a(u, v) = a (x, u, u ) D v + a 0 (x, u, u)v dx Ω =1 f(v) = fv dx dla f L 2 (Ω). Ω Tutaj D = x Ω jest ogranczonym obszarem zawartym w R 2 o Lpschtzowskm brzegu, L 2 (Ω) - przestrzeń funkcj ca lkowalnych w kwadrace. z norma f 2 L 2 (Ω) = Ω H 1 (Ω) = {f L 2 (Ω) : D f L 2 (Ω) = 1, 2} f 2 dx z norma f 2 H = (f 2 + ( f) 2 ) dx 1 Ω H 1 0(Ω) - podprzestrzeń funkcj z H 1 (Ω) z zerowym śladam na brzegu. Defnuje s e też przestrzeń H 1 0(Ω) jako domkn ece C 0 (Ω) w H 1 (Ω). Za lożymy elptyczność a(u, v) jak w [10] tzn. funkcje ν µ ogranczone dodatne take, że ξ = (ξ 1, ξ 2 ) R 2, ξ 0, p = (p 0, p 1, p 2 ) R 3, x Ω 3
ν(p ) ξ 2 =1,j=1 p j a (x, p )ξ ξ j µ(p ) Za lożymy, że forma (2) ma ogranczona nelnowość jak w [10] ξ 2 (3) =1 a C 1 (Ω R 3 ), = 0, 1, 2 (4) ν(p ) ν > 0 µ(p ) µ (5) max { a (x, 0, 0), a, a, } M (6) Ω, 0,j 2, 1 k 2 x k p j Defncja 1 Forma a(u, v) : H 1 0 H 1 0 R spe lna warunek slnej monotoncznośc jeśl γ > 0 u, v H 1 0 a(u, u v) a(v, u v) γ u v 2 H 1 (Ω) (7) Uwaga 2.1 Z slnej monotoncznośc wynka jednoznaczność rozwazana. Defncja 2 Forma a(u, v) : H 1 0 H 1 0 R spe lna warunek slnej elptycznośc jeśl µ 0 > 0, ξ = (ξ 0, ξ 1, ξ 2 ) R 3, ξ 0, p = (p 0, p 1, p 2 ) R 3 x Ω,j=0 p j a (x, p )ξ ξ j µ 0 ξ 2 (8) =0 W dwóch kolejnych lematach (np. [6]) przedstawone sa w lasnośc formy (2): Lemat 2.1 Przy za lożenu slnej elptycznośc forma a(u, v) : H 1 0 H 1 0 R jest slne monotonczna. Dowód: Skorzystajmy z tego, że dla u, v H 1 0(Ω) w punkce x: a (x, v, v) a (x, u, u) = 1 0 d dt a (x, (1 t)u + tv, (1 t) u + t v) dt = 4
wtedy 1 = 0 { j=1 p j a (x, (1 t)u + tv, (1 t) u + t v) x j (v u)+ + p 0 a (x, (1 t)u + tv, (1 t) u + t v)(v u)} dt a(v, v u) a(u, v u) = =1 Ω 1 0,j=1 a (x, q )(v u) (v u) + p 0 x p j a (x, q ) x j (v u) x (v u)+ j=1 + p 0 a 0 (x, q )(v u) 2 dt dx a 0 (x, q ) (v u)(v u) p j x j gdze q = (q 0, q 1, q 2 ) dla q 0 = (1 t)u + tv, q = (1 t) x u + t x v = 1, 2; zatem korzystajac z slnej elptycznośc mamy a(v, v u) a(u, v u) µ 0 Ω =1 ( x (v u)) 2 +(v u) 2 dx = µ 0 u v 2 H 1 Nastepny lemat określa kolejna w lasność formy a(, ), por. [6] Lemat 2.2 Jeśl a(u, v) : H0 1 H0 1 R ma ogranczona nelnowość, to znaczy jeśl spe lnony jest warunek (6), to M > 0 u, v, w H 1 0 a(u, w) a(v, w) M u v H 1 (Ω) w H 1 (Ω) (9) Dowód: Analogczne jak w dowodze poprzednego lematu otrzymujemy, że a(v, w) a(u, w) + =1 Ω 1 0,j=1 a (x, q ) (v u) w p j x j x a (x, q ) v u w + a 0 (x, q ) (v u) w p 0 x j=1 p j x j + a 0 (x, q ) v u) w dt dx p 0 5
gdze q = (q 0, q 1, q 2 ) dla q 0 = (1 t)u + tv, q = (1 t) x u + t x v = 1, 2; zatem korzystajac z (6) nerównośc Schwarza otrzymamy: a(v, w) a(u, w) M Ω,j=1 (v u) w + x j x =1 v u x w + + (v u) w + (v u) w dx M v u H 1 w H 1 j=1 x j Twerdzene 2.1 Przy za lożenach slnej monotoncznośc (9) stneje dok ladne jedno rozwazane zagadnena (2). Dowód można znaleźć np. w [5] lub [10, str.354-360] 6
3 Metoda elementu skończonego W tym rozdzale sformu lujemy zadane przyblżone dla zagadnena (2), którego rozwazane bedzemy chcel znaleźć numeryczne. Przedstawmy w nm równeż, jak dza la pochodna Gateaux nelnowego operatora, który powstane po dyskretyzacj problemu wyjścowego. W lasnośc postać pochodnej Gateaux bed a wykorzystane w dalszej cześc pracy w analze metody Newtona. 3.1 Przestrzeń elementu skończonego Nech Ω bedze obszarem o kszta lce welokata. Defnujemy cag zagneżdżonych trangulacj {T l } L l=1. Zaczynamy od trangulacj T 1 = {τ=1} 1 N 1 =1 gdze τ 1 reprezentuje pojedyńczy trójkat. Nastepne drobnejsze trangulacje T l = {τ=1} l N l =1 sa zdefnowane poprzez podza l pojedyńczych trójkatów w zborze T l 1 na klka trójkatów. Zak ladamy, że wszystke trangulacje sa regularne, co oznacza że dla każdego trójkata stosunek średncy okregu opsanego na trójkace do promena okregu wpsanego jest wekszy od pewnej sta lej, która ne zależy od kolejnych trangulacj. Nech h l = dam(τ l ) h l = max h l h = h L Za lóżmy, że każdy z trójkatów trangulacj T l 1 dzelmy na cztery trójkaty, tak aby h k+ h k C2 h k = 2 k h 0 Nech V l, l = 1,..., L bed a przestrzenam funkcj kawa lkam lnowym, cag lym znkajacym na Ω zwazanym z trangulacja T l odpowedno. Wtedy każda V l posada standardowa baze nodalna zwazan a z wez lam trangulacj T l V l = span{ϕ l } gdze = 1,..., N l. W szczególnośc V h = V L = span{ϕ L } dla = 1,..., N h. Przestrzene V l, = 1,..., L maja charakter pomocnczy bed a wykorzystane w dalszej cześc pracy. Oznaczmy przez u wektor wspó lrzednych u h w standardowej baze V h tzn u = {u } =1,...,Nh dla u h = N h =1 u ϕ L, u = u(x L ) dla x L - punktów nodalnych. Zauważmy, że operacja J L : J L (u h ) = u (10) jest lnowym zomorfzmem przestrzen V h R N h. Analogczne można przyporzadkować J l : V l R N l korzystajac z tego, że V l = span{ϕ l }. 7
3.2 Zagadnene dyskretne Problem dyskretny: Znaleźć u h V L = V h take,że v h V h a(u h, v h ) = f(v h ) (11) Używajac bazy nodalnej, czyl standardowej zwazanej z wez lam trangulacj, możemy ten problem przepsać jako uk lad nelnowych równań algebracznych A(u) = f (12) gdze f = {f(ϕ L )} 1,...,Nh u = {u } 1,...,Nh dla u h = N h =1 u ϕ L, u = u(x L ) x L - punkt nodalny czyl werzcho lk trójkatów trangulacj T L wewnatrz obszaru Ω. Zauważmy, że wtedy leżace (A(u), v) R N h = a(u h, v h ) (f, v) R N h = f(v h ) dla (u, v) R N h = Istnene rozwazana (11) ( równeż (12)) wynka z nastepuj acego lematu, którego dowód jest zawarty w np. (J.L.Lons) [11] Nech K(0, r) = {v H : v H r H} dla przestrzen Hlberta H. Lemat 3.1 (o kace ostrym) Nech H bedze skończene wymarowa przestrzena Hlberta z loczynem skalarnym [, ], nech P bedze cag l a funkcja z K(0,r) w H oraz nech Wtedy ξ K(0, r) take, że N h =1 u v ξ H [ξ, ξ] = r 2 : [P (ξ), ξ] 0. P (ξ) = 0 Uwaga 3.1 Jeżel zamast V h w (11) weźmemy dowolna podprzestrzeń skończene wymarowa H0(Ω) 1 to dowód ponższego lematu jest też prawdzwy. 8
Z powyższego lematu wynka Lemat 3.2 Uk lad (12) a tym samym problem (11) ma jednoznaczne rozwazane. Dowód: Jednoznaczność wynka z slnej monotoncznośc a(, ) tzn. rozwazanam (12), to jeśl u v sa γ u h v h 2 H 1 a(u h, u h v h ) a(v h, u h v h ) = Zdefnujmy operator D: = (A(u), u v) R N h (A(v), u v) R N h = 0 (Du, v) R N h := (u, v) D := (u h, v h ) H 1 (13) dla u h = N h =1 u ϕ L v h = N h =1 v ϕ L Oczywśce D jest dodatno określonym samosprzeżonym operatorem w R N h wtedy R N h z (, )D jest skończene wymarowa przestrzena Hlberta. Nech P (u) = D 1 (A(u) f) zauważmy, że na podstawe (6) (A(0), u) R N h = ( a (x, 0, 0) D u + a 0 (x, 0, 0)u) dx Ω =1 M ( D u + u ) dx M 3 ( D u 2 + u 2 ) 1/2 dx Ω =1 Ω =1 M 3 meas(ω) 1/2 ( D u 2 + u 2 dx) 1/2 = c u h H 1 = c u D Ω =1 dla sta lej c > 0. Ponadto (f, u) R N h f L 2 u h L 2 f L 2 (Ω) u D Zatem (A(0) f, u) R N h (A(0), u) R N h + (f, u) R N h (c + f L 2) u D = δ u D 9
wtedy (P (u), u) D = (A(u) A(0), u) R N h ( A(0) + f, u) R N h γ u 2 D δ u D zatem borac r take, że γ r δ 0 mamy, że u : u D = r; (P (u), u) D 0 P (u) jest cag le, wynka to z (9). (Co wecej można nawet pokazać, że P (u) spe lna warunek Lpschtza). Z poprzednego lematu wynka, że u K D (0, r) P (u) = 0 co oznacza, że A(u) = f to w po l aczenu z jednoznacznośca pokazana na poczatku dowodu pokazuje stnene rozwazana (11) w V h. 3.3 Pochodna Gateaux operatora jej w lasnośc Operator A z (12) ma przy za lożenu slnej ogranczonośc tj. warunku (6) pochodna Gateaux A, która ma nastepuj ac a postać: u, v, w V h (A (u)v, w) R N h = s(u h ; v h, w h ) = Ω,j=1 p j a (x, u h, u h ) + =1 v h w h + x j x j=1 a 0 (x, u h, u h ) v h w h (14) p j x j a (x, u h, u h )v h w h + a 0 (x, u h, u h )v h w h dx p 0 x p 0 Zauważmy, że forma s(u h ; v h, w h ) jest dwulnowa ze wzgl edu na v h w h. Uwaga 3.2 Jeśl dla u h V h x Ω p j a (x, u h (x), u h (x)) = p a j (x, u h (x), u h (x)) dla, j = 0, 1, 2 to forma s(u h ;, ) b edze symetryczna, co w szczególnośc da, że A (u) b edze samosprz eżony w R N h. 10
Oczywśce, przy za lożenach slnej elptycznośc mamy, że lnowy operator A (u) jest R N h - elptyczny z norm a energetyczna dla D z (13), co oznacza u R N h z t a sama sta l a γ > 0 u, v R N h (A (u)v, v) γ v 2 D = γ v h H 1 (15) Ponadto mamy także jednostajna ogranczoność A (u) z warunku (6) : u co oznacza R N h M > 0 u, v, w V h (A (u)v, w) M v D w D = M v h H 1 w h H 1 (16) 11
4 Addytywna welopozomowa metoda Schwarza dla równana Possona W tej cz eśc pokażemy konstrukcj e precondtonera B 1 dla równana (12). Ten precondtoner zosta l skonstruowany jako addytywna metoda Schwarza w pracach [8, Dryja,Wdlund] oraz [13, Zhang] dla równana Possona w jego s labym sformu lowanu tzn dla problemu Znaleźć u H 1 0(Ω) take, że: v H0(Ω) 1 b(u, v) = f(v) dla b(u, v) = u v dx f(v) = gdze f L 2 (Ω). Po dyskretyzacj powstaje problem Znaleźć u h V h take, że Ω Ω fv dx Zdefnujmy operator B : R N h R N h v h V h b(u h, v h ) = f(v h ) (17) (Bu, v) R N h = b(u h, v h ) gdy u jest reprezentacja wektorowa funkcj u h. Zdefnujemy teraz rozbce przestrzen V l, l = 1,..., L, V1 1 = V 1, V l = span{ϕ l }, gdze = 1,..., N l, l = 2,..., L oraz V l = span{ϕ l 1,..., ϕ l N l } Z konstrukcj trangulacj wynka, że V l V L, l < L wec przestrzeń elementu skończonego V h = V L reprezentuje suma L L V h = V l N l = V l l=1 l=1 =1 Z nerównośc Fredrchsa wynka, że w V h b(, ) 2 H1 M b(, ) Sta la M zależy tylko od średncy obszaru Ω. Jeżel oznaczymy przez Ṽ l = J L (V l ) R N h odpowedno Ṽ l = J L (V l ), to z lnowośc J L z (10) otrzymamy: L L R N N l h = Ṽ l = Ṽ l l=1 l=1 =1 12
Defnujemy P V l jak nastepuje : R N h Ṽ l, Q V l : R N h Ṽ l oraz operatory B V l : Ṽ l Ṽ l (B 1 u, v) R N h = (u, v) B u V 1 v V 1 (B V l u, v) R N h = (u, v) B u Ṽ l (P V l u, v) B = (u, v) B v Ṽ l v Ṽ l (Q V l u, v) R N h = (u, v) R N h v Ṽ l Poneważ Ṽ l dla l > 1 sa jednowymarowe wec rzut P V l u = s(u) J L (ϕ l ), gdze s(u) jest skalarem a J L (ϕ l ) wektorem, który jako sk ladowe ma wspó lrzedne funkcj ϕ l w baze span(ϕ L ), = 1,..., N h. Zatem rzut P V l ma postać: P V l u = poneważ 1 b(ϕ l, ϕ l ) b(u h, ϕ l ) J L (ϕ l ) = B 1 V l Q V l Bu dla l = 2,..., L = 1,..., N l s(u)b(ϕ l, ϕ l ) = s(u)(j L (ϕ l ), J L (ϕ l ) B = (P V l u, J L (ϕ l )) B = (18) oraz = (u, J L (ϕ l ) B = b(u h, ϕ l ) (B V l P V l u, J L (ϕ l )) R N h = (P V l u, J L (ϕ l )) B = a dla l=1 mamy Nech = (u, J L (ϕ l )) B = (Q V l Bu, J L (ϕ l )) R N h P V 1u = B 1 1 Q V 1Bu L N l L N l P MAS = P V l = ( B 1 Q V l V l )B = ( B) 1 B (19) l=1 =1 l=1 =1 Lemat 4.1 B 1 jest samosprz eżony w R N h. Dowód: Teza lematu wynka z samosprzeżonośc P V l w (, ) B. Nech u, v R N h. Wtedy stneja w, z R N h take że u = Bw v = Bz mamy (B 1 Q V l V l u, v) R N h = (B 1 Q V l V l Bw, Bz) R N h = 13
(BB 1 Q V l V l Bw, z) R N h = (w, P V l z) B = (Bw, B 1 Q V l V l Bz) R N h Zatem B 1 jako suma B 1 Q V l V l = (P V l w, z) B = (u, B 1 Q V l V l też jest samosprz eżony. v) R N h W pracy [13, Zhang] udowodnono twerdzene Twerdzene 4.1 Dla B 1 zdefnowanego jak wyżej operatora P MAS = ( B) 1 B zachodz c 1, c 2 > 0 u R N h c 1 (u, u) B (P MAS u, u) B c 2 (u, u) B Obe sta le sa nezależne od {h l } L. Defncja 3 Nech A B lnowe samosprzeżone. Powemy, że A B sa spektralne równoważne, A B jeśl c, C > 0 u R N h c(au, u) R N h (Bu, u) R N h C(Au, u) R N h Obe sta le c,c sa nezależne od N h. Z twerdzena 4.1 wynka wnosek: Wnosek 1 Dla B zdefnowanego w (19) otrzymujemy, że B B( B) 1 B Z tego wnosku wynka nastepuj acy lemat: Lemat 4.2 Dla B zdefnowanego w (19) otrzymujemy, że Dowód: Borac u R N h ( B) 1 B 1 oraz Bw = u mamy, że (( B) 1 u, u) R N h = (( B) 1 Bw, Bw) R N h = 14
= (B( B) 1 Bw, w) R N h c 2 (Bw, w) R N h = = c 2 (BB 1 Bw, w) R N h = c 2 (B 1 Bw, Bw) R N h = c 2 (B 1 u, u) R N h analogczne (( B) 1 u, u) R N h c 1 (B 1 u, u) R N h Ponższy lemat jest dobrze znanym faktem z analzy fukcjonalnej: Lemat 4.3 Nech A,B lnowe, A = A > 0 B = B > 0 w przestrzen Hlberta H z loczynem skalarnym (, ). Wtedy jeśl A B, to A 1 B 1 Dowód: Skorzystamy z tego, że dla B = B > 0 stneje B 1/2 (B = B 1/2 B 1/2 ), który jest samosprzeżony B 1/2 > 0. Pokażemy, że C = B 1/2 AB 1/2 I, bowem borac u = B 1/2 w mamy (B 1/2 AB 1/2 w, w) = (AB 1/2 w, B 1/2 w) = (Au, u) c (Bu, u) = c (BB 1/2 w, B 1/2 w) = c (w, w) w H Nerówność w druga strone dowodzmy analogczne. Oczywśce tak zdefnowane C = C > 0, zatem stneje C 1/2, wec borac w = C 1/2 u c (C 1 w, w) = c (C 1 C 1/2 u, C 1/2 u) = c (u, u) (Cu, u) = = (C 1/2 u, C 1/2 u) = (w, w) odwrotna nerówność uzyskujemy analogczne. Zatem C 1 I a to znaczy, że B 1/2 A 1 B 1/2 I. Teraz borac u = B 1/2 w otrzymamy (A 1 u, u) = (A 1 B 1/2 w, B 1/2 w) = (B 1/2 A 1 B 1/2 w, w) c (w, w) = c (B 1/2 u, B 1/2 u) = c (Bu, u) odwrotna nerówność otrzymujemy analogczne, a to dowodz, że A 1 B 1. Z dwóch ostatnch lematów wynka wnosek Wnosek 2 Dla B z (19) otrzymujemy, że B B 15
Zatem normy u B u B = b 1/2 (u h, u h ) u h H 1 u h V h. Nech K l bedze macerza sztywnośc określona w R N l odpowedno = dag(k l ), tzn.: D l K l = {b(ϕ l, ϕ l j)} j,=1,...,nl dla V l = Span{ϕ l } =1,...,Nl wtedy K L = B Nech Π l : R N l R N h, (l L) b edze standardowa macerza nterpolacj Π t l : R N h R N l bedze macerza transponowana do Π l. Wówczas B 1 można przedstawć jako B 1 = Π 1 K1 1 Π t 1 +... + Π l Dl 1 Π t l +... + Π L 1 DL 1Π t L 1 + DL 1 Zauważmy, że polczene B 1 u dla dowolnego wektora u V h wymaga rozwazana L nezależnych problemów można to zrobć równolegle. Koszt wyznaczena każdego elementu Π l Dl 1 Π t l jest rzedu N h poneważ trzeba przemnożyć przez macerze Π l, Π t l oraz dagonalna macerz Dl 1. Równocześne, gdybyśmy wyznaczal B 1 sekwencyjne, to możemy nterpolować z sasaduj acych pozomów tzn z V l 1 na V l z V l na V l 1. Zamast wyznaczać kolejne cz lony B 1 u nezależne, czyl kolejno lczyć Π l Dl 1 Π t lu sumujac na końcu, możemy polczyć Π t L 1u nterpolujac Π t Lu na pozom L-1, a nastepne przejść na pozom L-2 tak dalej. Analogczne, gdy wyznaczylśmy Dl 1 Π t lu to zamast nterpolować bezpośredno na L-ty pozom przechodzmy na l+1 pozom dodajemy do Dl+1 1 Πt l+1u przechodzmy na pozom l+2. Koszt polczena B 1 wtedy jest lnowy, tzn. rzedu N h. 16
5 Metoda teracyjna Rchardsona W tym rozdzale przedstawmy metode teracyjna rozwazywana problemu (12) z wykorzystanem B 1 opsanego w poprzednm rozdzale. Metoda ta jest uogólnenem dwupozomowej Addytywnej Metody Schwarza opsanej w referace [3, Ca,Dryja]. 5.1 Ops metody Do rozwazana uk ladu (12) zastosujemy metode teracyjna Rchardsona postac: u n+1 = u n τ B 1 (A(u n ) f), (20) gdze B 1 opsano w poprzednej cześc, a τ należy wybrać zgodne z nastepuj acym twerdzenem, którego dowód można znaleźć np. w [9] Twerdzene 5.1 Jeśl uk lad (12) ma rozwazane u spe lnone sa nastepuj ace dwa za lożena: δ 0 0 u, v R N h (A(u) A(v), u v) R N h δ 0 u v 2 B (21) δ 1 0 u, v R N h A(u) A(v) 2 B 1 δ 1 u v 2 B, (22) to wtedy metoda teracyjna (20) jest zbeżna dla 0 < τ < 2δ 0 δ 1 1 z oszacowanem u n u B ρ(τ) u n 1 u B, gdze ρ(τ) = (1 2 τδ 0 + τ 2 δ 1 ) 1/2 < 1 ρ(τ) ρ(τ ) = (1 δ0 2 δ1 1 ) 1/2, τ = δ 0 δ1 1 Dowód: Nech z n+1 = u n+1 u. Wtedy z (20) mamy z n+1 = z n τ B 1 (A(u n ) A(u)), zatem borac kwadrat normy energetycznej dla B otrzymujemy z n+1 2 B = z n 2 B 2τ(A(u n ) A(u), z n ) R N h + τ 2 (A(u n ) A(u)) 2 B 1 (1 2τδ 0 + τ 2 δ 1 ) z n 2 B = ρ(τ) 2 z n 2 B 17
Oczywśce a osaga mnmum dla τ dowodz tezy twerdzena. ρ(τ) < 1 dla 0 < τ < 2δ 0 δ 1 = δ 0 δ1 1 wynoszace ρ(τ ) = (1 δ0δ 2 1 1 ) 1/2, co Z Wnosku 2 z poprzednego rozdza lu wynka nastepuj acy lemat: Lemat 5.1 Operator A spe lna warunek (21) z Twerdzena 5.1, tzn. (A(u) A(v), u v) R N h δ 0 u v 2 B Dowód: (A(u) A(v), u v) R N h = a(u h, u h v h ) a(v h, u h v h ) γ u h v h 2 H δ 0 u v 2 B 1 Oznacza to spe lnene perwszego za lożena twerdzena 5.1. Spe lnene drugego za lożena twerdzena 5.1 wynka z nastepuj acego lematu: Lemat 5.2 Operator A spe lna warunek (22) z Twerdzena 5.1 tzn. δ 1 0 u, v R N h A(u) A(v) 2 B 1 δ 1 u v 2 B Dowód: Z (9) wynka, że δ 1 > 0 u, v, w R N h (A(u) A(v), w) R N h δ 1/2 1 u v B w B Nech g = A(u) A(v) mamy A(u) A(v) B 1 = B 1 g B B 1 g B = sup w R N h co kończy dowód lematu. sup ( B 1 g, w) B / w B = sup w R N h w R N h (g, w) R N h / w B (A(u) A(v), w) R N h / w B δ 1/2 1 u v B Z powyższych lematów Twerdzena 5.1 otrzymujemy nastepuj acy wnosek: 18
Wnosek 3 Metoda (20) dla zadana (12) jest zbeżna dla τ: 0 < τ < 2δ 0 δ 1 1 z oszacowanem gdze u n u B ρ(τ) n u 0 u B ρ(τ) = (1 2 τδ 0 + τ 2 δ 1 ) 1/2 < 1 Parametr optymalny wynos τ = δ 0 δ 1 1 dla nego mamy: ρ(τ ) = (1 δ 2 0 δ 1 1 ) 1/2 Tutaj ρ(τ) ne zależy od h an L - (lczby pozomów w konstrukcj B 1 ). 5.2 Implementacja Algorytm rozwazywana (12) można mplementować jako równoleg ly albo sekwencyjny. W ostatnm podrozdzale poprzednego rozdza lu opsano mplementacje B 1. Algorytm: u 0 dowolne repeat 1. r n = A(u n ) f 2. z n = B 1 r n = = (Π 1 K 1 1 Π t 1 +... + Π l D 1 l Π t l +... + Π L 1 D 1 L 1Π t L 1 + D 1 L ) r n 3. u n+1 = u n τz n untl zbeżność. Jeżel powyższy algorytm zamplementujemy jako równoleg ly na L procesorach, (L-lość pozomów),to można zauważyć, że speedup czyl stosunek czasu wykonana algorytmu na L procesorach do czasu wykonana na jednym procesorze wynos L. Równocześne komunkacja oraz synchronzacja sa newelke. 19
6 Metoda Newtona z wewn etrznym zewn etrznym teracjam W tym rozdzale opszemy zastosowane metody Newtona z wewnetrznym zewnetrznym teracjam do rozwazana (12) zob. np. [9, str 108-110]. Oczywśce poneważ H 1 B B to z (15) z (16) wynka, że u R N h A (u) jest dodatno określony w R N h ze sta l a nezależna od u tj. γ > 0 u, v R N h (A (u)v, v) γ v 2 B (23) oraz A (u) sa jednostajne ogranczone tj. M > 0 u, v, w R N h (A (u)v, w) M v B w B (24) Przy pewnych dodatkowych za lożenach na wspó lczynnk wyjścowego problemu mamy, że w pewnej kul S B o środku w rozwazanu u pochodna spe lna warunek Lpschtza: b > 0 u, v S w R N h (A (u) A (v))w B 1 b u v B w B (25) 6.1 Ops metody Do rozwazana (12) zastosujemy metode Newtona : u n A (u n )(u n+1 u n ) = A(u n ) + f (26) oznaczaja kolejne teracje w metodze Newtona. Przy danym u n aby uzyskać u n+1 trzeba rozwazać lnowy problem: gdze A (u n )v = g (27) v = u n+1 u n g = A(u n ) + f (28) Do rozwazana powyższego lnowego problemu użyjemy metody teracyjnej; może na być np. metoda Rchardsona. Proponujemy te metode, poneważ można pokazać jej zbeżność przy za lożenach, które nak ladamy na operator A. Zauważmy, że w szczególnośc A (u n ) ne mus być samosprzeżony w R N h. Metoda Rchardsona, por. (20), dla (27) ma postać: v m+1 = v m τ B 1 (A (u n )v m g) (29) 20
v m - bedzemy nazywal teracjam wewnetrznym w odróżnenu od u n teracj metody Newtona, które nazwemy teracjam zewnetrznym. τ należy dobrać zgodne z twerdzenem 5.1, którego za lożena sa spe lnone, zob. (23) (24). Wtedy z twerdzena 5.1 wynka oszacowane b l edu dla τ = γ/m v m v B ρ(τ) m v 0 v B gdze ρ(τ) = (1 γ 2 /M) Przy rozwazywanu (27) metoda (29) bedzemy bral perwsze przyblżene jako v 0 = 0. Podsumujmy: jeśl znamy u n, to aby znaleźć u n+1 należy teracyjne metoda (29) rozwazywać (26) borac zerowe perwsze przyblżene nastepne, jeśl v kn jest k n przyblżenem v - rozwazana, (27) to przyjmujemy, że u n+1 = u n + v kn jest dostateczne dobrym przyblżenem u n+1 z (26). Dalej to przyblżene oznaczamy dla wygody równeż u n+1. 6.2 Analza zbeżnośc Zdefnujemy teraz operator R n zmnejszena b l edu po po k n wewnetrznych teracjach przy zastosowanu metody teracyjnej do rozwazana (27), który bedze nam potrzebny w analze zbeżnośc metody zaproponowanej w poprzednm podrozdzale. Defncja 4 Nech R n bedze operatorem zmnejszena b l edu po k n wewnetrznych teracjach przy zastosowanu metody teracyjnej do rozwazana (27), tzn jeśl v jest rozwazanem (27) v m kolejne wewnetrzne teracje, to v kn v = R n (v 0 v) Oczywśce przy zastosowanu metody Rchardsona (29) mamy, że v m+1 v = v m v τ B 1 (A (u n )v m g) = (I τ A (u n ))(v m v) Zatem R n = (I τ B 1 A (u n )) kn R n q n = ρ(τ) kn < 1 21
Lemat 6.1 Borac zerowa perwsza teracje wewnetrzn a, tzn. v 0 = 0, otrzymamy, że k n -wewnetrzna teracja pokrywa se z rozwazanem nastepuj acego problemu lnowego: A (u n )(I R n ) 1 w = g Dowód: zob. np. [9, str. 89] Mamy v kn v = R n (v 0 v) = R n v stad podstawajac do (27) mamy w := v kn = R n v + v = (I R n )v v = (I R n ) 1 w gdy R n B < 1 poneważ jeśl R n B < 1 to (I R n ) jest odwracalny. Jest to znany fakt z analzy funkcjonalnej. Teraz korzystajac z tego, że u n+1 = v + u n g = A(u n ) + f, gdze v rozwazane (27) oraz korzystajac z powyższego lematu dostanemy, że przyblżene u n+1, które dalej też bedzemy oznaczać przez u n+1 bedze spe lnać zależność: A (u n )(I R n ) 1 (u n+1 u n ) = A(u n ) + f (30) Zauważmy, że jeśl oznaczymy C 1 = A (u n )(I R n ) 1 to powyższa metode można nterpretować, jako zwyk l a metoda Rchardsona z precondtonerem C 1. Teraz podamy klka pomocnczych lematów, które wykorzystamy póżnej w dowodze zbeżnośc. Kluczowy jest Lemat 6.4 z którego wynka zbeżność metody. Lemat 6.2 Jeśl spe lnone jest u, v S w R N h (A (u) A (v))w B 1 b u v B w B to A(v) A(u) A (u) (v u) B 1 b 2 1 v u 2 B 22
Dowód: Nech z = v u. Wtedy stad A(u + z) A(u) A (u) z = 1 0 (A (u + tz) A (u)) z dt A(u + z) A(u) A (u) z B 1 z za lożena lematu 1 0 1 b tz B z B dt b z 2 B 0 (A (u + tz) A (u)) z B 1 dt 1 0 t dt = 2 1 b z 2 B Lemat 6.3 Z (23) (24) otrzymujemy odpowedno u, v V h A (u)v M v B 1 B u, v R N h Dowód: Korzystajac (24) mamy, że (A (u)) 1 v B 1 γ v B 1 A (u)v B 1 = B 1 A (u)v B = ( B 1 A (u)v, w) sup B w R N h w B = (A (u)v, w) = sup R N h w R N h w B oraz na podstawe (23) dla v B 0 M v B γ v B (A (u)v, v) R N h v B = ( B 1 A (u)v, v) B v B = ( B 1 A (u)v, w) = sup B w R N h w B zatem borac v = (A (u)) 1 w = B 1 A (u)v B = A (u)v B 1 u, w R N h (A (u)) 1 w B 1 γ w B 1 23
co kończy dowód lematu. Nech K B(u, r) = {v R N h : u v B r} Nastepuj acy lemat mów o zbeżnośc metody (30) por. [9, str 108-109] Lemat 6.4 Nech u bedze rozwazanem (12), zaś S = K B(u, r). Nech γ > 0 u, v R N h (A (u)v, v) γ v 2 B M > 0 u, v, w R N h (A (u)v, w) M v B w B b > 0 u, v S w R N h Wtedy dla R n spe lnajacego (A (u) A (v))w B 1 b u v B w B R n q n < 1 dla u n z S z u n+1 spe lnajacym (30) mamy oszacowane z n+1 B 1 γ (2 1 l z n 2 B + ξ n ) (31) gdze z n = u n u, z n+1 = u n+1 u ξ n = q n (1 q n ) 1 M u n+1 u n B Dowód: Z lematu 6.3 otrzymujemy u S v R N h A (u)v B 1 M v B (32) (A (u)) 1 v B 1 γ v B 1 (33) Z (30) mamy, że gdze A (u n )z n+1 = g 0 + g 1 g 0 = A(u) A(u n ) A (u n )z n g 1 = A (u n )[(I R n ) 1 I](u n+1 u n ) 24
zatem z (33) mamy, że z n+1 B = A (u n ) 1 (g 0 + g 1 ) B γ 1 ( g 0 B 1 + g 1 B 1) Z Lpschtzowskośc A w S oraz z lematu 6.2 wynka, że u, z takch, że u, u + z S w ec otrzymujemy, że A(u + z) A(u) A (u) z B 1 2 1 b z 2 B g 0 B 1 = A(u) A(u n ) A (u n )z n B 1 2 1 b z n 2 B na podstawe (32) tego, że R n < q n < 1 otrzymujemy też, że g 1 B 1 = A (u n )[(I R n ) 1 I](u n+1 u n ) B 1 M R n (I R n ) 1 (u n+1 u n ) B q n (1 q n ) 1 u n+1 u n B poneważ [(I R n ) 1 I] = [I (I R n )](I R n ) 1 = [R n (I R n ) 1 ] oraz R n (I R n ) 1 q n (1 q n ) 1 Z powyższego lematu wynka twerdzene o zbeżnośc (30) Twerdzene 6.1 Jeśl spe lnone sa za lożena powyższego lematu jeśl promeń r kul S wszystke q n sa dostateczne ma le tak, że q n (1 q n ) 1 Mγ 1 q < 1 (1 q) 1 (2 1 γ 1 b r + q) α < 1 to wtedy przy u 0 S (30) zbega z oszacowanem z k B α k z 0 B 25
Dowód: Jeśl z k B r to z lematu za lożeń twerdzena mamy, że w ec z k+1 B γ 1 b 2 1 r z k B + q( z k+1 B + z k B) co dowodz tezy twerdzena. z k+1 B α z k B Powyższe twerdzene stwerdza, że jeśl u 0 jest dostateczne blsko rozwazana (12) u jeśl teracje wewnetrzne dostateczne dobrze zbegaja tzn. q n < 1 jest dostateczne ma le, to metoda (30) jest zbeżna. Gdyby R n = 0 to byśmy mel do czynena ze standardowa metoda Newtona. 6.3 Implementacja Algorytm rozwazywana (12) można mplementować jako równoleg ly albo sekwencyjny. Różnce wystepuj a w mplementacj B 1, który stosujemy przy lczenu wewnetrznych teracj. Algorytm: u 0 dane repeat 1. r n = A(u n ) + f 2. Oblczyć Jakoban A (u n ) 3. Rozwazać uk lad A (u n )w n = r n v 0 = 0 repeat (a) x m = A (u n )v m r n (b) z m = B 1 x m = = (Π 1 K1 1 Π t 1 +... + Π l Dl 1 Π t l +... + Π L 1 DL 1Π t L 1 + DL 1 ) x m (c) v m+1 = v m τz m untl b l ad resdualny dostateczne ma ly po k n teracjach. 26
4. w n = v kn 5. u n+1 = u n + w n untl zbeżność. Jeżel powyższy algorytm zastosujemy jako równoleg ly na L procesorach, (Llość pozomów),to można zauważyć, że speedup czyl stosunek czasu wykonana algorytmu na L procesorach do czasu wykonana na jednym procesorze wynos L. Równocześne komunkacja oraz synchronzacja sa newelke. 27
7 Eksperymenty numeryczne W tym rozdzale przedstawmy klka wynków numerycznych eksperymentów zwazanych z algorytmam przedstawonym w rozdza lach 5 6. Te eksperymenty zosta ly przeprowadzone na sprzece sun4m z procesorem sparc Instytutu Matematyk Stosowanej Mechank, na jednostkowym kwadrace podzelonym na kwadraty jednakowej welkośc dla nastepuj acego równana: { u + u (ux + u y ) = f(x, y) w Ω u = 0 na Ω W [2, Bank, Rose] przeprowadzono eksperymenty dla metody Newtona dla tego samego zagadnena. Ne spe lna ono wszystkch za lożeń, które przedstawlśmy w rozdzale 1. Kolejne trangulacje otrzymujemy poprzez podza l kwadratów z kolejnych pozomów na dwa trójkaty jednakowej welkośc. W perwszej tabel podane sa wynk dla algorytmu opsanego w rozdzale 5, tzn metody Rchardsona: u n+1 = u n τ B 1 (A(u n ) f) Parametr τ dobrano dośwadczalne, tzn. tak aby otrzymać mnmalna lczbe teracj. W ostatnej kolumne podane sa lczby teracj konecznych, aby b l ad resdualny byl mnejszy od b l edu poczatkowego pomnożonego przez ustalony czynnk 10 4 w norme B 1. Pozomy Newadome τ Lczba teracj 2 (4 1) 2 1.7 32 3 (8 1) 2 1.73 32 4 (16 1) 2 1.74 33 5 (32 1) 2 1.735 34 6 (64 1) 2 1.715 38 7 (128 1) 2 1.7 41 8 (256 1) 2 1.69 44 W nast epnej tabel przedstawamy zależność metody Rcharsona od parametru τ. Eksperyment przeprowadz lśmy na 5 pozomach, tzn. dla (32 1) 2 28
newadomych z tym samym warunkem stopu. parametr τ Lczba teracj 1.5 140 1.6 76 1.7 41 1.72 37 1.73 35 1.735 34 1.74 33 1.745 37 1.75 52 1.76 metoda ne zbega W nastepnej tabel przedstawone sa wynk dla metody Newtona z wewnetrznym zewnetrznym teracjam, metody opsanej w rozdzale 6, por. [2]. W ostatnej kolumne podano lczby teracj zewnetrznych (tzn teracj metody Newtona) potrzebnych do tego, aby b l ad resdualny by l mnejszy od b l edu poczatkowego pomnożonego przez ustalony czynnk 10 4 w norme B 1. Lczba teracj wewnetrznych potrzebnych w każdej teracj zewnetrznej zależy od warunku stopu oraz poneważ stosujemy metode Rchardsona, od parametu τ. Jako warunek stopu wzelśmy zmnejszene poczatkowego b l edu resdualnego o czynnk 10 4. Zauważy lśmy, że znalezene zbyt dok ladnego rozwazana w teracjach wewnetrznych ne zmnejsza lczby teracj zewnetrznych, ale oczywśce zbyt nedok ladne rozwazane zwekszy lość teracj zewnetrznych. Pozomy Newadome Lczba teracj zewnetrznych 2 (4 1) 2 4 3 (8 1) 2 6 4 (16 1) 2 6 5 (32 1) 2 6 6 (64 1) 2 5 7 (128 1) 2 5 8 (256 1) 2 5 Z eksperymentów wynka, że lczby teracj ne zależy od lczby newadomych lczby pozomów. Jak wynka z tabelk 2, parametr τ ma stotny wp lyw na metod e Rchardsona. 29
Lteratura [1] Bank, R. E., and Rose, D. J. : Global approxmate Newton methods. Numersche Mathematk, 37 : 279-295, 1981. [2] Bank, R. E., and Rose, D. J. : Analyss of a Multlevel Iteratve Method for Nonlnear Fnte Elements Equaton. Mathematcs of Computaton, 39 : 453-465, 1982. [3] Ca, X-C, Dryja, M. : The addtve Schwarz method for quaslnear fnte element ellptc problems. The Seventh Int. Conf. on DDM. October, 1993, The Penn State Unversty, USA. [4] Carlet, P. G. : The Fnte Element Method for Ellptc Problems. North- Holland, 1978. [5] Carlet, P. G., Schultz, M. H., and Varga, R. S. : Numercal Methods of Hgh-Order Accuracy for Nonlnear Boundary Value Problems. Numersche Mathematk, 13 : 51-77, 1969. [6] Dryja, M. : Metoda Galerkna naprzemennych kerunków dla quaslnowych równań parabolcznych. Rocznk Polskego Towarzystwa Matematycznego, Sera III: Matematyka Stosowana XV, 1979. str 5-23. [7] Dryja, M., and Wdlund O. B. : Some doman decomposton algorthms for ellptc problems. In Lnda Hayes and Dawd Kncad, edtors, Iteratve Methods for Large Lnear Systems, pages 273-291, San Dego, Calforna, 1989. Academc Press. Proceedngs of the Conference on Iteratve Methods for Large Lnear Systems held n Austn, Texas, October 19-21, 1988, to celebrate the sxty-ffth brthday of Davd M. Young, Jr. [8] Dryja, M., and Wdlund O. B. : Multlevel addtve methods for ellptc fnte element problems. In Wolfgang Hackbusch, edtor, Parallel Algorthms for Partal Dfferental Equatons, Proceedngs of the Sxth GAMM-Semnar, Kel, January 19-21, 1990, Braunschweg, Germany, 1991, Veweg & Son. [9] D yakonov, E. G. : Mnmzaton of Computatonal Work. Asymptotcally Optmal Algorthms for Ellptc Problems. Moscow, 1989. 30
[10] Ladyzenskaya, O. A., Uralceva N. N.: Lnear and quaslnear ellptc partal dfferental equatons, Moscow, 1973. (po rosyjsku) [11] Lons, J. L. : Quelques méthodes de résoluton des problemes aux lmtes nonlnéares, Pars, 1969. [12] Ortega, J. M., and Rhenboldt, W. C. : Iteratve soluton of nonlnear equatons n several varables. New York, Academc Press, 1970. [13] Zhang, X. : Multlevel Schwarz methods. Numersche Mathematk, 63 : 521-539, 1992. 31