Implementacja efektywnych metod opisu korelacji elektronowej w dużych układach molekularnych Krzysztof Kowalczyk Wydział Chemii UJ Zakład Metod Obliczeniowych Chemii promotor: dr Marcin Makowski 27 maja 2009
Spis treści 1 Wprowadzenie 2 Formalizm 3 Implementacja 4 Wyniki 5 Podsumowanie Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 2 / 40
Wprowadzenie Plan pracy implementacja LT-AO MP2 kwadratowo skalujący się algorytm liniowo skalujący się algorytm obliczenia dla wybranych układów Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 3 / 40
Wprowadzenie MP2 - co to jest? metoda rachunku zaburzeń Møllera-Plesseta drugiego rzędu poprawka do energii HF occ virt E 2 = ij ab (ia jb)[2(ia jb) (ib ja)] ɛ a + ɛ b ɛ i ɛ j Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 4 / 40
Wprowadzenie MP2 - co to jest? metoda rachunku zaburzeń Møllera-Plesseta drugiego rzędu poprawka do energii HF occ virt E 2 = ij ab (ia jb)[2(ia jb) (ib ja)] ɛ a + ɛ b ɛ i ɛ j najprostsza metoda post-hf odtwarza większą część korelacji elektronowej dobrze odtwarza efekty dyspersyjne oraz efekty przeniesienia ładunku Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 4 / 40
Wprowadzenie MP2 - wady obliczenia w bazie orbitali molekularnych, ale całki dwuelektronowe liczone są w bazie orbitali atomowych konieczna jest zmiana bazy (ia jb) = (µν λσ)c µi C νa C λj C σb µνλσ transformacja ta ma złożoność czasową O(N 5 ) wysoka złożoność pamięciowa Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 5 / 40
Transformacja Laplace a Formalizm definicja L[f ](x) = transformacja funkcji stałej L[1](x) = 0 0 f (t)e tx dt e tx dt = 1 x równanie na poprawkę do energii (Almlöf, 1991) E 2 = 0 iajb (ia jb)[2(ia jb) (ib ja)]e (ɛa+ɛ b ɛ i ɛ j )t dt Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 6 / 40
Transformacja Laplace a Formalizm orbitale ważone energią i = i e ɛ i t/2 a = a e ɛat/2 poprawka do energii E 2 = (i a j b )[2(i a j b ) (i b j a )]dt 0 i j a b wada: dodatkowe całkowanie (numeryczne) zalety: uwalniamy się od mianownika poprawka do energii niezmiennicza ze względu na transformację unitarną ważonych energią orbitali Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 7 / 40
Formalizm Wybór bazy możemy wybrać dowolną bazę kryteria wyboru bazy lokalność możliwie najtańsze do obliczenia całki dwuelektronowe dobry kandydat: baza orbitali atomowych Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 8 / 40
Formalizm Formalizm LT-AO MP2 orbitale molekularne w bazie orbitali atomowych i = µ µ C µi a = κ κ C κa poprawka do energii przyjmuje postać E 2 = (µν κλ)[2(αβ γδ) (αδ γβ)] 0 ijab µνκλ αβγδ C µi C νj C κa C λb C αi C βj C γa C δb e ɛ i t e ɛ j t e ɛat e ɛbt dt Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 9 / 40
Formalizm LT-AO MP2 Formalizm macierze pseudogęstości (Häser, 1993) occ X µν = C µi C νi e ɛ i t i virt Y µν = C µa C νa e ɛat a transformacja orbitali atomowych µ = ν X µν ν µ = ν Y µν ν poprawka do energii wyrażona w przetransformowanych orbitalach E 2 = (µν λσ)[2(µν λσ) (µσ λν)]dt 0 µνλσ Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 10 / 40
Formalizm Formalizm LT-AO MP2 czteroetapowa transformacja (µν κλ) = σ (µν κλ) = σ (µν κλ) = σ (µν κλ) = σ X µσ (σν κλ) Y νσ (µσ κλ) X κσ (µν σλ) Y λσ (µν κσ) Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 11 / 40
Formalizm Formalizm LT-AO MP2 transformacja funkcji bazy jest równie kosztowna co zamiana bazy w konwencjonalnym sformułowaniu MP2 koszt wynikający z dodatkowego całkowania gdzie zysk? Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 12 / 40
Formalizm Formalizm LT-AO MP2 transformacja funkcji bazy jest równie kosztowna co zamiana bazy w konwencjonalnym sformułowaniu MP2 koszt wynikający z dodatkowego całkowania gdzie zysk? macierze X i Y są rzadkie (dla dużych układów) ich struktura umożliwia eliminację znaczącej ilości całek Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 12 / 40
Formalizm Preselekcja metoda zwiększania wydajności obliczeń opiera się na oszacowaniu obliczanej wartości zaniedbywalnie małe wartości są pomijane wykorzystujemy nierówność Schwarza (µν λσ) (µν µν)(λσ λσ) Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 13 / 40
Preselekcja Formalizm wkład do poprawki do energii od całki (µν λσ) θ = (µν λσ)[2(µν λσ) (µσ λν)] = (µν λσ)[2(µν λσ) (µσ λν)] górne oszacowanie wkładu do poprawki do energii θ (µν λσ) [2 (µν λσ) + (µσ λν) ] z nierówności Schwarza [ ] θ (µν µν)(λσ λσ) 2 (µν µν)(λσ λσ) + (µσ µσ)(λν λν) Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 14 / 40
Preselekcja Formalizm szacowanie całek diagonalnych (µν µν) = κλ (µν µν) = κλ ( X µκ X µλ (κν λν) X µκ (κν κν) κ ( Y νκ Y νλ (µκ µλ) Y νκ (µκ µκ) κ ) 2 ) 2 bierzemy mniejszą z tych wartości ( (µν µν) min X µκ (κν κν), κ κ Y νκ (µκ µκ) ) Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 15 / 40
Preselekcja Formalizm macierze Schwarza (Häser, 1993) A µν = (µν µν) B µν = (µν µν) C µν = (µν µν) ( D µν = min X µκ C κν, κ κ Y νκ B νκ ) całkę (µν λσ) możemy pominąć, jeżeli θ A µν A λσ (2D µν D λσ + D µσ D λν ) Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 16 / 40
Formalizm Preselekcja wyznaczenie wszystkich całek w bazie atomowej ma koszt O(N 4 ) transformacja tych całek ma koszt O(N 5 ) korelacja jest efektem krótkozasięgowym jej zasięg wyraża się naturalnie przez rzadką strukturę macierzy gęstości wykorzystanie tej struktury na etapie preselekcji pozwala zredukować koszt obliczeniowy preselekcja na wszystkich etapach transformacji całek na pierwszym etapie pozwala uniknąć generacji zaniedbywalnie małych całek na pozostałych etapach pozwala zmniejszyć koszt transformacji oczekiwana redukcja kosztu obliczeniowego do O(N 2 ) Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 17 / 40
Formalizm Przybliżenie multipolowe nierówność Schwarza (µν λσ) (µν µν)(λσ λσ) znacznie przeszacowuje wartość całki dla odległych centrów dystrybucji ładunku Ω A ( r 1 ) = µν Ω B ( r 2 ) = λσ Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 18 / 40
Przybliżenie multipolowe Formalizm wykorzystanie rozwinięcia multipolowego operatora 1/r AB (Lambrecht, Ochsenfeld, 2005) 1 r AB = n=0 r n AB R n+1 P n(cosθ) rozwinięcie multipolowe całki dwuelektronowej (A B) = lm jk q A lmθ AB lm,jkq B jk moment multipolowy qlm A = R lm ( r A )Ω A ( r A )d r A macierz oddziaływań Θ lm,jk ( R) = ( 1) j I l+j,m+k ( R) Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 19 / 40
Przybliżenie multipolowe Formalizm iloczyn momentów multipolowych q A lmq B jk MM (l+j) MM (n) przybliżenie multipolowe całki dwuelektronowej (A B) MM(0) R nie wiemy na którym n poprzestać + MM(1) R 2 +... Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 20 / 40
Przybliżenie multipolowe Formalizm uśredniony sferycznie moment multipolowy = Ω A ( r A )r n r 2 dr M (n) A odległość między efektywnymi zasięgami rozkładów ładunków R = R AB R A R B za pomocą M (n) i R możemy oszacować sumaryczną wartość wszystkich momentów multipolowych wyższych rzędów Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 21 / 40
Przybliżenie multipolowe Formalizm oszacowanie wartości za pomocą momentu multipolowego n-tego rzędu (µν λσ) (µν λσ) (µν λσ) M (0) µν M (0) λσ R 1 M (0) µν M (0) λσ R + M (0) µν M (0) λσ R + + M (1) µν M (0) λσ + M(0) R 2 R M (1) µν M (0) λσ + M(0) R 2 M (2) µν M (0) λσ + 2M(1) µν M (1) λσ + M(0) R 3 R 2 µν M (1) λσ µν M (1) λσ + µν M (2) λσ Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 22 / 40
Kwadratura Implementacja zastąpienie całkowania sumowaniem E 2 = e 2 (t)dt 0 τ w α e 2 (t α ) α potrzebujemy zestawu τ par {t α, w α } błąd oszacowania dla zadanej kwadratury [ δ = e 2 (t)dt 0 ] τ 2 w α e 2 (t α ) α τ wpływa na dokładność oszacowania i na czas obliczeń możliwie małe τ, które da rozsądną dokładność Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 23 / 40
Implementacja Optymalizacja kwadratury poszukujemy optymalnego zestawu {t α, w α } za pomocą metody najmniejszych kwadratów (M. Häser and J. Almlöf, 1992) xmax x min [ 1 τ 2 f (x) x w α exp( xt α )] dx = min! α dokładność rzędu µ-hartree dla τ równego 5-8 dla większego τ algorytm źle uwarunkowany numerycznie dla uzyskania większych dokładności potrzebne inne podejście do problemu Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 24 / 40
Implementacja Kwadratura Eulera-McLaurina transformacja układu współrzędnych E 2 = 0 e 2 (t)dt = 1 0 e 2 (t) dt 1 dr dr = f 2 (r)dr proponowana transformacja (Ayala, Scuseria, 1999) 0 t(r) = Kk=n+2 a k r k (1 r) m przechodzimy na skończone granice całkowania funkcja f 2 (r) jest stosunkowo mało zmienna Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 25 / 40
Implementacja Kwadratura Eulera-McLaurina przybliżenie całki poprzez sumę E 2 = 1 0 f 2 (r)dr τ f 2 (r α )w α α proponowana postać sumy E 2 1 τ k f 2 τ + 1 }{{} α τ + 1 + 1 2 (f 2(0) + f 2 (1)) }{{} w α t α Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 26 / 40
Schemat obliczeń Implementacja dla każdego punktu kwadratury przygotuj dane do preselekcji oblicz całki w bazie atomowej wykonaj czteroetapową transformację oblicz przyczynek do energii Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 27 / 40
Przechowywanie całek Implementacja Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 28 / 40
Implementacja Algorytm wieloprzebiegowy e 2 = µ ( ) (µν λσ)[2(µν λσ) (µσ λν)] νλσ dla każdego punktu kwadratury dla każdego podzbioru µ przygotuj dane do preselekcji oblicz całki w bazie atomowej wykonaj czteroetapową transformację oblicz przyczynek do energii Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 29 / 40
Implementacja Algorytm wieloprzebiegowy Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 30 / 40
Implementacja Algorytm wieloprzebiegowy Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 31 / 40
Dokładność metody Wyniki liniowy łańcuch wody, baza STO-3G, τ = 10, ε = 10 8 liniowe alkany, baza 6-31G**, τ = 10, ε = 10 8 Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 32 / 40
Dokładność metody Wyniki zasada błąd względny adenina 1, 23 10 3 cytozyna 2, 68 10 4 guanina 1, 06 10 3 tymina 7, 32 10 4 a-t 2, 46 10 3 c-g 7, 00 10 4 zasady nukleotydowe, baza 6-31G**, τ = 10, ε = 10 8 Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 33 / 40
Złożoność czasowa Wyniki liniowy łańcuch wody, baza STO-3G, τ = 10, ε = 10 8 liniowe alkany, baza 6-31G**, τ = 10, ε = 10 8 Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 34 / 40
Złożoność pamięciowa Wyniki liniowy łańcuch wody, baza STO-3G, τ = 10, ε = 10 8 liniowe alkany, baza 6-31G**, τ = 10, ε = 10 8 Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 35 / 40
(Nie)liniowe skalowanie Wyniki liniowy łańcuch wody, baza STO-3G, τ = 10, ε = 10 8 Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 36 / 40
Kontrola dokładności Wyniki łańcuch 10 cząsteczek wody, pamięć 300 łańcuch 10 cząsteczek wody, pamięć 300 MB, baza 6-31G**, ε = 10 8 MB, baza 6-31G**, τ = 10 Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 37 / 40
Podsumowanie Wnioski duży zysk na złożoności pamięciowej i czasowej dla dużych przestrzennie układów względem konwencjonalnego MP2 dobra dokładność łatwe sterowanie dokładnością za pomocą parametrów kwadratury i preselekcji preselekcja wykorzystująca rozwinięcie multipolowe zmniejsza zapotrzebowanie na pamięć, ale w obecnej wersji nie zmniejsza czasu obliczeń Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 38 / 40
Podsumowanie Podsumowanie zrobiłem MP2 w bazie orbitali atomowych kwadratura Eulera-McLaurina struktury do przechowywania przetransformowanych całek preselekcja wykorzystująca nierówność Schwarza i rozwinięcie multipolowe Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 39 / 40
Podsumowanie Bibliografia J. Almlöf, Chem. Phys. Lett. 181, 319 (1991) M. Häser and J. Almlöf, J. Chem. Phys. 96, 1 (1992) M. Häser, Theor. Chim. Acta 87, 147-173 (1993) P. Ayala and G. Scuseria, J. Chem. Phys. 110, 8 (1999) D. Lambrecht, and C. Ochsenfeld, J. Chem. Phys. 123, 184101 (2005) Krzysztof Kowalczyk (ZMOCh) LT-AO MP2 27 maja 2009 40 / 40