Uniwersytet Jagielloński

Podobne dokumenty
Implementacja efektywnych metod opisu korelacji elektronowej w dużych układach molekularnych

Opis korelacji elektronowej w dużych układach molekularnych. Implementacja metodologii LT-AO-MP2

Efektywny opis wybranych w laściwości dużych uk ladów molekularnych w ramach metodologii MP2

Oddzia lywania miedzycz. jony molekularne lub atomy. edzy A i B:

Wyk lad 7 Baza i wymiar przestrzeni liniowej

Uniwersytet Jagielloński Wydzia l Chemii. Efektywny opis wybranych w laściwości dużych uk ladów molekularnych w ramach metodologii MP2

Hierarchia baz gaussowskich (5)

Wyk lad 7 Metoda eliminacji Gaussa. Wzory Cramera

Niezb. ednik matematyczny. Niezb. ednik matematyczny

i elektronów w czasteczkach (laboratoryjnym) operator Hamiltona dla czasteczki dwuatomowej (jadra 2M b a i b; m -masa elektronu e 2 r ij

JEDNOSTKI ATOMOWE =1, m e =1, e=1, ; 1 E 2 h = 4, J. Energia atomu wodoru lub jonu wodoropodobnego w jednostkach atomowych:

Korelacja elektronowa w metodzie elongacji

Rozdzia l 11. Przestrzenie Euklidesowe Definicja, iloczyn skalarny i norma. iloczynem skalarnym.

Wyk lad 9 Baza i wymiar przestrzeni liniowej

Notatki do wyk ladu IV (z )

Metoda oddzia lywania konfiguracji (CI)

Struktura elektronowa czasteczek. przybliżenie Borna-Oppenheimera. równania Schrödingera dla elektronów przy ustalonym po lożeniu jader

Wyk lad 9 Podpierścienie, elementy odwracalne, dzielniki zera

Rotacje i drgania czasteczek

Uk lady modelowe II - oscylator

Indeks odwzorowania zmiennej zespolonej wzgl. krzywej zamknietej

Notatki do wyk ladu V (z ) Metoda Hartree-Focka (Hartree ego-focka)

Algorytm określania symetrii czasteczek

Architektura systemów komputerowych

TEORIA FUNKCJONA LÓW. (Density Functional Theory - DFT) Monika Musia l

po lożenie cz astki i od czasu (t). Dla cz astki, która może poruszać siȩ tylko w jednym wymiarze (tu x)

Teoria funkcjona lu g Density Functional Theory (DFT)

Statystyka w analizie i planowaniu eksperymentu

Uklady modelowe III - rotator, atom wodoru

CHEMIA KWANTOWA MONIKA MUSIA L METODA HÜCKLA. Ćwiczenia. mm

Wyk lad 6 Podprzestrzenie przestrzeni liniowych

Statystyka w analizie i planowaniu eksperymentu

Normy wektorów i macierzy

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Wyk lad 8 macierzy i twierdzenie Kroneckera-Capellego

Metoda Hartree-Focka (Hartree ego-focka)

WYK LAD 5: GEOMETRIA ANALITYCZNA W R 3, PROSTA I P LASZCZYZNA W PRZESTRZENI R 3

Testowanie hipotez statystycznych

Dyskretne modele populacji

Podstawowe metody i przybliżenia: metoda wariacyjna, rachunek zaburzeń

Notatki do wyk ladu IV (z ) Metoda Hartree-Focka (Hartree ego-focka)

po lożenie cz astki i od czasu (t). Dla cz astki, która może poruszać siȩ tylko w jednym wymiarze (tu x)

Stany atomu wieloelektronowego o określonej energii. być przypisywane elektrony w tym stanie atomu.

Wyk lad 9 Przekszta lcenia liniowe i ich zastosowania

ANALIZA II 15 marca 2014 Semestr letni. Ćwiczenie 1. Czy dan a funkcjȩ da siȩ dookreślić w punkcie (0, 0) tak, żeby otrzymana funkcja by la ci ag la?

Wyk lad 9 Baza i wymiar przestrzeni liniowej

Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

Symbol termu: edu (sumy ca lkowitego orbitalnego momentu edu i ca lkowitego spinu) Przyk lad: 2 P 3. kwantowa

Metody obliczeniowe chemii kwantowej oparte na funkcji falowej. Dla uk ladu N elektronów i K j ader atomowych hamiltonian przyjmuje postać:

Wyk lad 4 Macierz odwrotna i twierdzenie Cramera

Wyk lad 5 W lasności wyznaczników. Macierz odwrotna

Testowanie hipotez statystycznych

1 Przestrzenie unitarne i przestrzenie Hilberta.

Ekonomia matematyczna i dynamiczna optymalizacja

Czastka swobodna Bariera potencja lu Pud lo jednowymiarowe FEMO Pud la wielowymiarowe. Wyk lad 3. Uk lady modelowe I

Wyk lad 3 Wyznaczniki

Sterowalność liniowych uk ladów sterowania

Wyk lad 11 1 Wektory i wartości w lasne

Dyskretne modele populacji

Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

Funkcje dwóch zmiennych

Wyk lad 14 Formy kwadratowe I

Niesimpleksowe metody rozwia zywania zadań PL. Seminarium Szkoleniowe Edyta Mrówka

Monika Musia l. METODA MIESZANIA KONFIGURACJI Configuration Interaction (CI) (ujȩcie wyznacznikowe)

Pochodne cz ¾astkowe i ich zastosowanie.

Korelacja elektronowa. e z rachunku prawdopodobieństwa i statystyki. Zmienne losowe x i y sa. ρ(x, y) = ρ 1 (x) ρ 2 (y)

Symetria w obliczeniach molekularnych

Zagadnienie Dualne Zadania Programowania Liniowego. Seminarium Szkoleniowe Edyta Mrówka

Teoria funkcjona lu g

że w wyniku pomiaru zmiennej dynamicznej A, której odpowiada operator αˆ otrzymana zostanie wartość 2.41?

{E n ( k 0 ) + h2 2m (k2 k 2 0 )}δ nn + h m ( k k 0 ) p nn. c nn = E n ( k)c nn (1) gdzie ( r)d 3 r

Uzgadnianie wyrażeń rachunku predykatów. Adam i orzeszki. Joanna Józefowska. Poznań, rok akademicki 2009/2010

Testowanie hipotez statystycznych

c n (z z 0 ) n (2) Powiemy, że szereg Laurenta (2) jest zbieżny, jeśli każdy z szeregów zdefiniowanych w (1) jest f(z). Sume

Grupy i cia la, liczby zespolone

Statystyka w analizie i planowaniu eksperymentu

w teorii funkcji. Dwa s lynne problemy. Micha l Jasiczak

Metody obliczeniowe chemii teoretycznej

Grzegorz Mazur. Zak lad Metod Obliczeniowych Chemii UJ. 14 marca 2007

Metoda Simplex bez użycia tabel simplex 29 kwietnia 2010

Wyk lad 4 Dzia lania na macierzach. Określenie wyznacznika

Statystyka w analizie i planowaniu eksperymentu

Procesy Stochastyczne - Zestaw 1

Statystyka w analizie i planowaniu eksperymentu lista nr 7

Analiza dla informatyków 2 DANI LI2 Pawe l Domański szkicowe notatki do wyk ladu

u nk = n c nn u n 0 wyznacza siȩ empirycznie (elementy przejść) lub próbuje oszacować w obliczeniach typu ab initio Rachunek zaburzeń Löwdina

FUNKCJE LICZBOWE. x 1

Aproksymacja kraw. Od wielu lokalnych cech (edge elements) do spójnej, jednowymiarowej. epnej aproksymacji

POCHODNA KIERUNKOWA. DEFINICJA Jeśli istnieje granica lim. to granica ta nazywa siȩ pochodn a kierunkow a funkcji f(m) w kierunku osi l i oznaczamy

edzi (local edge detectors) Lokalne operatory wykrywania kraw

Zadania o liczbach zespolonych

Wyk lad 3 Wielomiany i u lamki proste

20PLN dla pierwszych 50 sztuk oraz 15PLN dla dalszych. Zysk ze sprzedaży biurka wynosi 40PLN dla pierwszych 20 sztuk oraz 50PLN dla dalszych.

STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA

Obliczenia iteracyjne

Drzewa podstawowe poj

Wyznaczniki, macierz odwrotna, równania macierzowe

5. Obliczanie pochodnych funkcji jednej zmiennej

Sterowanie optymalne dla uk ladów nieliniowych. Zasada maksimum Pontriagina.

Układy równań i nierówności liniowych

Transkrypt:

Uniwersytet Jagielloński Wydzia l Chemii, Zak lad Chemii Teoretycznej praca magisterska Implementacja efektywnych metod opisu korelacji elektronowej w dużych uk ladach molekularnych Krzysztof Kowalczyk Promotor: dr Marcin Makowski Kraków 2009

Implementacja efektywnych metod opisu korelacji elektronowej w dużych uk ladach molekularnych Streszczenie Metoda rachunku zaburzeń Møllera-Plesseta drugiego rzedu jest jedn z podstawowych metod ab initio chemii kwantowej uwzgledniaj acych efekty korelacji kulombowskiej. Jednakże jej wysoka z lożoność czasowa i pamieciow czyni j bezużyteczn dla dużych uk ladów molekularnych. Celem niniejszej pracy by la implementacja przeformu lowanego formalizmu tej metody wykorzystujacego transformacje Laplace a. Algorytm ten operuje w bazie orbitali atomowych, wykazujac kwadratow z lożoność czasow i pamieciow dla dużych uk ladów. Zaimplelentowano także algorytm wykorzystujacy rozwiniecie multipolowe, co umożliwi lo osiagni ecie liniowego skalowania pamieciowego. Ponadto wykonano za pomoc zaimplementowanego algorytmu obliczenia dla wybranych uk ladów modelowych celem potwierdzenia jego poprawności i wydajności. S lowa kluczowe: rachunek zaburzeń, MP2, transformacja Laplace a, momenty multipolowe, z lożoność czasowa, z lożoność pami eciowa

Implementation of the effective methods of description of the coulombic correlation in large molecular systems Abstract Møller-Plesset second-order perturbation theory is a cornerstone of ab initio quantum chemistry methods which takes into account effects of the coulombic correlation. However, high time and memory complexity of this method makes it unusable for large molecular systems. The aim of this work was an implementation of the re-formulated formalism of the method, which uses Laplace transform and operates in atomic orbitals basis. This led to the algorithm that scales quadratically in time and memory domain. An algorithm using multipole expansion was also implemented and memory linear scaling was achieved. Additionally, calculations for selected model systems were made, to prove its correctness and efficiency. Keywords: perturbation theory, MP2, Laplace transform, multipole moments, memory scaling, time scaling

Sk ladam podzi ekowania Panu Doktorowi Marcinowi Makowskiemu oraz Panu Doktorowi Grzegorzowi Mazurowi za życzliwość oraz pomoc okazan mi przy pisaniu tej pracy

Spis treści 1 Wprowadzenie 4 1.1 Metoda MP2.................................. 5 1.2 Metoda LT-AO MP2.............................. 6 1.2.1 Transformacja Laplace a........................ 7 1.2.2 MP2 w bazie orbitali atomowych................... 7 1.2.3 Wstepn selekcja............................ 9 1.3 Wykorzystanie rozwinieci multipolowego................... 11 2 Implementacja 17 2.1 Kwadratura................................... 17 2.1.1 Metoda najmniejszych kwadratów................... 18 2.1.2 Kwadratura Eulera-McLaurina.................... 19 2.2 Struktury do przechowywania ca lek...................... 20 2.3 Opis algorytmu................................. 22 3 Wyniki 25 3.1 Dok ladność................................... 25 3.2 Kontrola dok ladności.............................. 28 3.3 Z lożoność czasowa................................ 30 3.4 Z lożoność pamieciow.............................. 35 4 Podsumowanie 38 3

Rozdzia l 1 Wprowadzenie Intensywny rozwój takich dziedzin nauki jak biochemia czy inżynieria materia lowa stawia coraz wi eksze wymagania metodom obliczeniowym chemii. Rośnie zapotrzebowanie na wydajne i dok ladne algorytmy umożliwiajace teoretyczne przewidywanie w laściwości coraz bardziej z lożonych uk ladów. Stale zwiekszaj ace sie możliwości obliczeniowe wspó lczesnych komputerów nie nadażaj jednakże za wzrostem wymagań stawianych im przez coraz bardziej zaawansowane modele teoretyczne i algorytmy obliczeniowe. Konieczne staje si e zatem wypracowanie metod, które wykorzystaj możliwości obliczeniowe komputera w najbardziej wydajny sposób, zapewniajac otrzymanie dok ladnych wyników w jak najkrótszym czasie. Optymalnym zachowaniem algorytmu jest jego liniowe skalowanie czasowe wraz ze wzrostem rozmiaru uk ladu. Jednakże nawet podstawowe metody chemii kwantowej, takie jak metoda Hartree-Focka, nie osiagaj liniowego skalowania czasowego bez z lożonych modyfikacji algorytmu. Metody te nie uwzgledniaj w dodatku efektów korelacji kulombowskiej, co czyni je ma lo przydatnymi w świetle problemów, z którymi zmaga si e wspó lczesna chemia kwantowa. Zaawansowane metody wychodzace poza przybliżenie Hartree-Focka, takie jak metoda sprzeżonych klastrów lub metoda mieszania konfiguracji, pozwalaj na osiagni ecie bardzo dobrej dok ladności, lecz ich skalowanie czasowe czyni je praktycznie bezużytecznymi w zastosowaniach odnoszacych sie do dużych uk ladów. Alternatyw dla metod opartych na funkcji falowej jest teoria funkcjona lów g estości, jednakże metody na 4

Rozdzia l 1. Wprowadzenie 5 niej oparte, jakkolwiek maj z lożoność obliczeniow porównywaln ze z lożoności metody Hartree-Focka oraz dobrze odtwarzaj korelacje kulombowska, czesto nie opisuj poprawnie efektów przeniesienia ladunku oraz efektów dyspersyjnych. Niniejsza praca opisuje implementacj e przeformu lowanego w 1991 roku formalizmu metody MP2 [1], pozwalajacego na uzyskanie algorytmu skalujacego sie kwadratowo dla dużych uk ladów. Opisano także implementacj e zaproponowanego w 2005 roku formalizmu wykorzystujacego rozwiniecie multipolowe [2-3], co pozwala na osiagni ecie liniowego skalowania czasowego i pamieciowego dla dużych uk ladów. Motywacj do wykonania tej pracy by l brak publicznie dost epnej implementacji tych metod do zastosowań produkcyjnych. W drugiej cz eści pracy przedstawiono także wyniki obliczeń dla wybranych uk ladów. 1.1 Metoda MP2 Metoda rachunku zaburzeń Møllera-Plesseta [4] jest jedn z najprostszych metod chemii kwantowej wychodzacych poza przybliżenie Hartree-Focka. Jednocześnie pozwala ona na efektywne oszacowanie efektów kulombowskiej korelacji elektronowej, jak również, w przeciwieństwie do metod opartych na teorii funkcjona lów g estości, na odtworzenie efektów dyspersyjnych oraz efektów przeniesienia ladunku. Metoda ta dobrze odtwarza wieksz cz eść dynamicznej korelacji kulombowskiej dla stanu podstawowego jakościowo opisanego jednym wyznacznikiem, nie nadaje si e jednak do opisu stanów wzbudzonych i korelacji statycznej. Pomimo tego jest ona obecnie podstaw obliczeń ab initio dla wielu uk ladów, w znaczacym stopniu rekompensujac niedoskona lości metody Hartree-Focka. Metoda MP2 pozwala na wyznaczenie poprawki do energii elektronowej otrzymanej metod Hartree-Focka. Poprawka do energii dla metody Møllera-Plesseta drugiego rzedu (MP2) dla uk ladów zamknietopow lokowych wyraża sie nastepuj aco [4]: occ virt E = ij ab (ia jb)[2(ia jb) (ib ja)] ɛ a + ɛ b ɛ i ɛ j (1.1) gdzie i, j oznaczaj zajete, a a, b - wirtualne orbitale molekularne, otrzymane z obliczeń

Rozdzia l 1. Wprowadzenie 6 metodami SCF, ɛ a, ɛ b, ɛ i, ɛ j - energie orbitalne, zaś (ia jb) jest ca lk dwuelektronowa: (ia jb) = i( r 1 )j( r 2 ) 1 r 12 a( r 1 )b( r 2 )d r 1 d r 2 (1.2) Pomimo, że metoda MP2 ma relatywnie niewielkie jak na metod e post-hf wymagania dotyczace mocy obliczeniowej i pamieci operacyjnej komputera, w swym konwencjonalnym sformu lowaniu wykazuje wciaż nieproporcjonalny wzrost wymagań dotyczacych zasobów sprz etowych wraz ze wzrostem rozmiaru uk ladu. Z powodu konieczności wykonania transformacji ca lek dwuelektronowych z bazy orbitali atomowych do bazy orbitali molekularnych: (ia jb) = (µν λσ)c µi C νa C λj C σb (1.3) µνλσ metoda ta osiag z lożoność czasow O(N 5 ) [4], gdzie N jest liczb funkcji bazy. Konieczność przechowywania cz eściowo przetransformowanych ca lek oznacza z kolei z lożoność pamieciow algorytmu wynoszac O(N 4 ) [4]. Transformacja bazy jest etapem limitujacym szybkość obliczeń metody MP2, ograniczajac jej stosowalność do czasteczek zawierajacych maksymalnie oko lo 100 elektronów lub odznaczajacych sie wysok punktow grup symetrii [5]. 1.2 Metoda LT-AO MP2 Duża z lożoność czasowa i pamieciow metody MP2 stoi w sprzeczności z fizyk efektów korelacyjnych. Korelacja kulombowska w uk ladach niemetalicznych jest bowiem zjawiskiem lokalnym i krótkozasiegowym, a efekt ten przek lada sie na przyk lad na rzadk strukture macierzy gestości. Metoda MP2, operujac w zdelokalizowanej bazie orbitali molekularnych, nie wykorzystuje tej w lasności macierzy g estości, dlatego też pojawi la si e konieczność przeformu lowania jej formalizmu, tak, aby uzyskać lepsze skalowanie czasowe i pami eciowe przy jednoczesnym zachowaniu dok ladności obliczeń. Przeszkod w sformu lowaniu alternatywnego formalizmu metody MP2 jest mianownik w wyrażeniu na poprawk e do energii (równ. 1.1), ponieważ uniemożliwia on dokonanie

Rozdzia l 1. Wprowadzenie 7 transformacji unitarnych na orbitalach molekularnych wystepuj acych w tym wyrażeniu. W 1991 roku Almlöf zaproponowa l metod e usuni ecia tego problemu poprzez zastosowanie transformacji Laplace a [6]. 1.2.1 Transformacja Laplace a Transformacja Laplace a, zdefiniowana wzorem: L[f](x) = 0 f(t)e tx dt (1.4) w przypadku funkcji sta lej pozwala na zastapienie dzielenia ca lkowaniem: L[1](x) = 0 e tx dt = 1 x Zastosowanie tej transformacji do wyrażenia na poprawk e do energii metody MP2: E = 0 (1.5) (ia jb)[2(ia jb) (ib ja)]e (ɛa+ɛ b ɛ i ɛ j )t dt (1.6) ijab a przez to usuni ecie mianownika z u lamka, sprawia, że wyrażenie to staje si e niezmiennicze ze wzgledu na transformacje unitarn ważonych energi orbitali: i = i e ɛ it/2 j = j e ɛ jt/2 (1.7) (1.8) a = a e ɛat/2 (1.9) b = b e ɛ bt/2 (1.10) Poprawka do energii wyrażona w ważonych energi orbitalach molekularnych przyjmuje postać: E = 0 1.2.2 MP2 w bazie orbitali atomowych i j a b (i a j b )[2(i a j b ) (i b j a )]dt (1.11) Zastosowanie transformacji Laplace a do wyrażenia na poprawk e do energii pozwala na wyrażenie jej w dowolnej bazie orbitalnej. Majac swobode wyboru bazy szukamy takiej, która jest możliwie dobrze zlokalizowana (w przeciwieństwie do zdelokalizowanej bazy

Rozdzia l 1. Wprowadzenie 8 orbitali molekularnych) i pozwala la na możliwie szybkie wyznaczenie ca lek dwuelektronowych. Baza orbitali atomowych, jako optymalna baza spe lniaj ac powyższe warunki, jest najbardziej oczywistym wyborem [1]. Orbital molekularny można przedstawić jako kombinacje liniow orbitali atomowych: i = µ j = ν a = κ b = λ µ C µi (1.12) ν C νj (1.13) κ C κa (1.14) λ C λb (1.15) Wstawienie powyższych równań do wyrażenia na poprawk e do energii (równ. 1.11) prowadzi do uzyskania sumy: E = (µν κλ)[2(αβ γδ) (αδ γβ)] (1.16) 0 ijab µνκλ αβγδ C µi C νj C κa C λb C αi C βj C γa C δb e ɛit e ɛjt e ɛat e ɛbt dt Wprowadzajac tzw. macierze pseudogestości X i Y, zdefiniowane przez Häsera [1] jako: oraz oznaczajac: X µν = Y µν = occ i virt a C µi C νi e ɛ it (1.17) C µa C νa e ɛat (1.18) µ = ν µ = ν X µν ν (1.19) Y µν ν (1.20) można zapisać wyrażenie na poprawk e do energii w postaci: E = 0 (µν λσ)[2(µν λσ) (µσ λν)]dt (1.21) µνλσ Podstawowym zagadnieniem obliczeniowym metody LT-AO MP2 staje si e wyznaczenie wartości ca lek typu (µν λσ). Używajac macierzy pseudogestości, można wyznaczyć wartość

Rozdzia l 1. Wprowadzenie 9 ca lki dwuelektronowej (µν λσ), wykonujac czteroetapow transformacje: (µν κλ) = σ (µν κλ) = σ (µν κλ) = σ (µν κλ) = σ X µσ (σν κλ) (1.22) Y νσ (µσ κλ) (1.23) X κσ (µν σλ) (1.24) Y λσ (µν κσ) (1.25) Taka transformacja funkcji bazy wydaje si e być równie kosztowna czasowo i pami eciowo, co zmiana bazy w konwencjonalnym sformu lowaniu metody MP2 (równ. 1.3). Dodatkowo pojawia sie koszt wynikajacy z konieczności ca lkowania numerycznego zwiazanego z zastosowaniem transformacji Laplace a. Zysk dotyczacy czasu obliczeń i zajetości pamieci uzyskuje sie, wykorzystujac fakt, iż macierze pseudogestości s dla dużych uk ladów macierzami rzadkimi. Oznacza to, że wiele ca lek dwuelektronowych można pominać przy obliczeniach, zaś wybór adekwatnych struktur danych, w których wartości obliczonych ca lek bed przechowywane, pozwala zredukować także z lożoność pamieciow problemu. Zysk dotyczacy czasu obliczeń i z lożoności pami eciowej uzyskuje si e po zastosowaniu mechanizmu wst epnej selekcji. 1.2.3 Wst epna selekcja Wstepn selekcja (ang. prescreening) jest metod redukcji z lożoności obliczeniowej algorytmu, polegajac na wykrywaniu i pomijaniu w obliczeniach zaniedbywalnie ma lych wielkości (zazwyczaj ca lek dwuelektronowych). Algorytm wst epnej selekcji dla metody LT-AO MP2 zaproponowany przez Häsera [1] opiera si e na wykorzystaniu szeregu typu nierówności Schwarza [7] do szacowania wk ladów do poprawki do energii od poszczególnych ca lek. Mechanizm ten zostanie zilustrowany na przyk ladzie selekcji ca lek atomowych w pierwszym etapie transformacji. B l ad wartości ca lkowitej energii zwiazany z zaniedbaniem pojedynczej ca lki (µν λσ) jest pojedynczym wyrazem sumy z wyrażenia 1.21: θ = (µν λσ)[2(µν λσ) (µσ λν)] (1.26)

Rozdzia l 1. Wprowadzenie 10 Równanie 1.16 można przepisać, dokonujac transformacji na ca lkach wewnatrz nawiasów kwadratowych. W takim przypadku wyrażenie 1.26 przyjmuje postać: θ = (µν λσ)[2(µν λσ) (µσ λν)] (1.27) Zgodnie z powyższym wyrażeniem szacuje si e wartości bezwzgl edne ca lek dwuelektronowych: θ (µν λσ) [2 (µν λσ) + (µσ λν) ] (1.28) Z nierówności Schwarza: (µν λσ) (µν µν)(λσ λσ) (1.29) wynika postać wyrażenia, za pomoc którego szacowana jest wartość b l edu w wartości poprawki do energii po zaniedbaniu pojedynczej ca lki: θ (µν µν)(λσ λσ) [ 2 (µν µν)(λσ λσ) + (µσ µσ)(λν λν) ] (1.30) Wyznaczenie wartości b l edu dla diagonalnych ca lek typu (µν λσ) ca lek wymaga jednakże obliczenia wszystkich atomowych ca lek dwuelektronowych ze wzgl edu na konieczność wykonania sumowania po wszystkich czterech indeksach ca lki (równ. 1.22-1.25). Zamiast tego Häser [1], opierajac sie na nierówności Schwarza oraz nierówności trójkata, poda l wyrażenia pozwalajace na oszacowanie tych wartości: (µν µν) = κλ (µν µν) = κλ X µκ X µλ (κν λν) Y νκ Y νλ (µκ µλ) ( κ ( κ 2 X µκ (κν κν) ) (1.31) Y νκ (µκ µκ) ) 2 (1.32) Ponieważ wartości ca lek szacowane s z góry, do obliczeń bierze sie mniejsz z dwóch powyższych wartości: 1 (µν µν) min ( κ X µκ (κν κν), κ Y νκ (µκ µκ) ) (1.33) 1 Wzór (1.33) jest zgodny z wyrażeniami (31) i (32) w pracy Häsera [1]; analogiczny wzór (3.9) w pracy Ayali i Scuserii [12] zawiera b l edy drukarskie.

Rozdzia l 1. Wprowadzenie 11 Opierajac sie na zdefiniowanych przez Häsera [1] macierzach A, B, C i D: 2 A µν = (µν µν) (1.34) B µν = (µν µν) (1.35) C µν = (µν µν) (1.36) ( D µν = min X µκ C κν, ) Y νκ B νκ (1.37) κ κ można zapisać wyrażenie na oszacowanie wartości b l edu wniesionego do poprawki do energii przez pomini ecie ca lki (µν λσ): θ A µν A λσ (2D µν D λσ + D µσ D λν ) (1.38) Analogiczna procedura wst epnej selekcji może być zastosowana na każdym etapie transformacji, co pozwala znaczaco zredukować liczbe potrzebnych do obliczenia ca lek dwuelektronowych. Zamiast obliczenia i transformacji N 4 ca lek, wyznacza si e cztery dwuindeksowe wielkości A, B, C i D i za ich pomoc eliminuje sie ca lki, których wk lad do poprawki do energii jest mniejszy od zadanej wartości ε. Przyk ladowo, na pierwszym etapie transformacji ca lka (µν λσ) nie b edzie liczona, jeżeli: A µν A λσ (2D µν D λσ + D µσ D λν ) ε (1.39) Zastosowanie powyższego warunku pozwala na znaczace zmniejszenie liczby ca lek potrzebnych do transformacji. Na kolejnych etapach transformacji algorytm ten pozwala na eliminacj e cz eściowo przetransformowanych ca lek, co prowadzi do zmniejszenia ich liczby w nastepnym etapie. Formalne rozważania pozwalaj na pokaznie, że prowadzi to do otrzymania kwadratowo skalujacego sie algorytmu [12]. 1.3 Wykorzystanie rozwini ecia multipolowego W sytuacji, gdy centra dystrybucji ladunku Ω A i Ω B : Ω A ( r 1 ) = µν A (1.40) 2 Nazewnictwo zgodne z prac Ayali i Scuserii [12]; odpowiednie macierze w pracy Häsera [1] oznaczane s jako Q, X, Y i Z.

Rozdzia l 1. Wprowadzenie 12 Ω B ( r 2 ) = λσ B (1.41) s od siebie znacznie oddalone, nierówność Schwarza znaczaco przeszacowuje wartość ca lki dwuelektronowej (A B): (A B) = µ( r 1 )ν( r 1 ) 1 λ( r 2 )σ( r 2 )d r 1 d r 2 = r 12 Ω A ( r 1 ) 1 r 12 Ω B ( r 2 )d r 1 d r 2 (1.42) Innymi s lowy, nierówność Schwarza nie uwzgl ednia zależności 1/r 12. Dla dużych uk ladów molekularnych eliminacja ca lek dwuelektronowych, których wartość jest zaniedbywalnie ma la ze wzgl edu na odleg lość pomi edzy opisywanymi przez nie rozk ladami ladunku, może przynieść istotny zysk obliczeniowy. W 2005 roku Lambrecht i Ochsenfeld [9] zaproponowali metod e preselekcji uwzgl edniajac charakter zanikania oddzia lywania kulombowskiego pomiedzy dystrybucjami ladunków. Wykorzystali oni rozwini ecie multipolowe operatora oddzia lywania 1/r 12 i na jego podstawie wyprowadzili nierówności pozwalajace oszacować z góry wartość ca lki dwu- elektronowej za pomoc momentów multipolowych. Rozwiniecie multipolowe operatora 1/r 12 ma postać: 1 r12 n = r 12 R P n(cosθ) (1.43) n+1 n=0 gdzie P n (cosθ) jest wielomianem Legendre a rzedu n, θ jest katem pomiedzy wektorami r 12 = r 1A r 2B oraz R = r 2 r 1. Wektory r 1A i r 2B s zdefiniowane nastepuj aco: r 1A r 1 A (1.44) r 2B r 2 B (1.45) Wstawiajac rozwiniecie multipolowe we wspó lrz ednych sferycznych (równ. 1.43) do wyrażenia na ca lk e dwuelektronowa, otrzymuje sie: (A B) = qlmθ A AB lm,jkqjk B (1.46) lm jk gdzie wyrażenia qlm A i qjk B oznaczaj momenty multipolowe liczone wzgledem centrum dystrybucji A lub B: q A lm = q B jk = R lm ( r A )Ω A ( r A )d r (1.47) R jk ( r B )Ω B ( r B )d r (1.48)

Rozdzia l 1. Wprowadzenie 13 R lm i R jk to regularne tensory kuliste dla zestawów liczb kwantowych lm i jk: R nm ( r) = 1 (n m)!(n + m)! rn C nm (ϕ, ϑ) (1.49) Wyrażenie C nm jest cześci katow tensora kulistego zwiazan z funkcj kulist zależnościa: 4π C nm (ϕ, ϑ) = 2n + 1 Y lm(ϕ, ϑ) (1.50) Rzad momentu multipolowego wyrażonego we wspó lrz ednych sferycznych wynosi odpowiednio l i j. Wyrażenie Θ AB lm,jk jest elementem macierzy oddzia lywań: Θ lm,jk ( R) = ( 1) j I l+j,m+k ( R) (1.51) gdzie I l+j,m+k ( R) jest nieregularnym tensorem kulistym: I lm ( R) (n m)!(n + m)! = C R n+1 nm (ϕ, ϑ) (1.52) Alternatywnie, można wyrazić rozwini ecie multipolowe ca lki dwuelektronowej we wspó lrz ednych kartezjańskich: (A B) = ( 1) k +l +m Q A klmtk+k AB,l+l,m+m QB k l m (1.53) klm k l m gdzie odpowiednie sk ladowe momentów multipolowych liczonych wzgledem centrum dystrybucji A lub B, wyrażone we wspó lrz ednych kartezjańskich, maj postać: Q A 1 klm = x k k!l!m! AyAz l A m Ω A ( r A )d r (1.54) Q B k l m = 1 x k k!l!m! ByBx l m B Ω B ( r B )d r (1.55) Ca lkowity rzad tak zdefiniowanego momentu multipolowego (równ. 1.54) wyraża sie jako n = k+l+m, gdzie k, l oraz m s sk ladowymi momentu multipolowego wzgledem odpowiednich wspó lrz ednych. T klm AB T klm AB = jest tensorem multipolowym we wspó lrz ednych kartezjańskich: n ( ) 1 (1.56) Rx R k y R l z m R = ( 1)n k!l!m! 2 n R n+1 k/2 l/2 m/2 s=0 t=0 u=0 ( 1) s+t+u (2n 2s 2t 2u)! s!t!u!(k 2s)!(l 2t)!(m 2u)!(n s t u)! ( ) k 2s ( ) l 2t ( ) m 2u Rx Ry Rx R R R

Rozdzia l 1. Wprowadzenie 14 Rozwijajac wyrażenie 1.53 oraz oznaczajac kombinacje liniow iloczynów Q A klmq B k l m jako MM (n) takich że k + l + m + k + l + m n, można wyrazić rozwini ecie ca lki dwuelektronowej w szereg: (A B) MM(0) R + MM(1) R 2 + + MM(n) R n+1 + (1.57) Takie rozwiniecie ma jednakże istotn wade: nie wiadomo nic o monotoniczności elementów powyższego szeregu, zatem nie wiadomo a priori, na której wartości n obciać jego rozwiniecie. W zwiazku z tym Lambrecht i Ochsenfeld zaproponowali alternatywn metode szacowania wartości ca lki za pomoc sferycznie uśrednionego momentu multipolowego [2]. Sferycznie uśredniony moment multipolowy wyraża si e jako: M (n) A = Ω A ( r A )r n r 2 dr (1.58) Ca lka taka ma t e w laściwość, że jej wartość jest oszacowaniem z góry wartości modu lu dowolnej sk ladowej nie uśrednionego sferycznie momentu multipolowego: M (n) M (n) (1.59) Wprowadzajac efektywne zasiegi rozk ladów ladunku, R A i R B, zdefiniowane jako odleg lość, dla której wartość iloczynu funkcji należacych do dystrybucji Ω A lub Ω B liczona wzgledem centrum dystrybucji jest mniejsza co do modu lu od zadanej wartości (wartość ta ma analogiczna role do wspó lczynnika obcieci w metodzie MP2) oraz oznaczajac R jako efektywna odleg lość biorac pod uwage te zasiegi: R = R AB R A R B (1.60) można wyrazić wartość ca lki dwuelektronowej za pomoc sferycznie uśrednionych momentów multipolowych oraz zdefiniowanych powyżej efektywnych odleg lości mi edzy zasi egami rozk ladów ladunku. Oszacowanie takie ma te zalete, że za pomoc sferycznie uśrednionego momentu multipolowego n-tego rzedu można przybliżyć sumaryczn wartość momentów multipolowych wszystkich wyższych rz edów. Przyk ladowo, można szacować wartość ca lki

Rozdzia l 1. Wprowadzenie 15 za pomoc momentu multipolowego zerowego rzedu: M (0) (µν λσ) R 1 µν M (0) λσ (1.61) Takie wyrażenie szacuje sumaryczn wartość momentów multipolowych zerowego i wszystkich wyższych rzedów. Używajac wyrażenia na dok ladn wartość momentu multipolowego zerowego rzedu, można oszacować wartość ca lki za pomoc tej dok ladnej wartości oraz sumarycznej wartości momentów multipolowych rzedów wyższych od zerowego: M (0) (µν λσ) µν M (0) λσ R + M (1) µν M (0) λσ + M(0) µν M (1) λσ R 2 R (1.62) Analogicznie szacuje sie wartość ca lki za pomoc dok ladnej wartości momentu multipolowego pierwszego rz edu: (µν λσ) + M (0) µν M (0) λσ R + R 2 M (2) µν M (0) λσ + 2M(1) µν M (1) λσ + M(0) R 3 R 2 M (1) µν M (0) λσ + M(0) µν M (1) λσ µν M (2) λσ + (1.63) Takie szacowanie wartości ca lek dwuelektronowych pozwala na uwzgl ednienie oddzia lywań zanikajacych jak 1/R wraz ze wzrostem odleg lości miedzy centrami dystrybucji. W przypadku wyrażenia na poprawk e do energii mamy do czynienia z iloczynami ca lek, a wi ec z iloczynami ich oszacowań za pomoc rozwinieci multipolowego [3]. Przyk ladowo, wyrażenie na oszacowanie wartości iloczynu dwukrotnie przetransformowanych ca lek ma postać: M (1) (µν λσ)(µν λσ) A M (0) B M (0) (1) A M B R 2 ÃB R2 + (1.64) A B (2) ( M + A M (0) (1) B + 2 M A M (1) B )M (0) (1) A M B (R 3 ÃB R 2 ÃB )R2 + A B M (1) + A M (0) B (M (0) (2) A M B + 2M (1) (1) A M B ) (R 2 ÃB (R 3 A B R 2 A B ) + (2) ( M + A M (0) (1) B + 2 M A M (1) B )(M (0) (2) A M B + 2M (1) (1) A ) M B (R 3 ÃB R 2 ÃB )(R 3 A B R 2 A B ) gdzie symbole z tyld odnosz sie do iloczynu przetransformowanych orbitali atomowych.

Rozdzia l 1. Wprowadzenie 16 Z powodu ortogonalności macierzy X i Y wartości momentów multipolowych zerowego rzedu w wyrażeniach na oszacowanie przetransformowanych ca lek s równe zeru. Uzwgled- niajac dodatkowo fakt, że oddzia lywania dla iloczynów oszacowań ca lek zanikaj jak 1/R 4 wraz ze wzrostem odleg lości, można uzyskać asymptotycznie liniowe skalowanie czasowe uk ladu.

Rozdzia l 2 Implementacja Implementacja opisanego formalizmu metod LT-AO MP2 oraz LS-LT-AO MP2 zosta la wykonana w ramach projektu niedoida [9]. Projekt niedoida, stworzony i rozwijany w Zak ladzie Metod Obliczeniowych Chemii Wydzia lu Chemii UJ, jest samodzielnym pakietem bibliotek u latwiajacych wykonywanie obliczeń kwantowochemicznych [10]. 2.1 Kwadratura Zastosowanie transformacji Laplace a do wyrażenia na poprawk e do energii (równ. 1.6) oznacza konieczność przeprowadzenia ca lkowania numerycznego. Oznaczajac wyrażenie podca lkowe z równ. (1.6) jako e, można je wyrazić poprzez sum e: E = 0 τ e(t)dt w α e(t α ) (2.1) α=1 G lównym problemem metody jest znalezienie odpowiedniej kwadratury, tzn. takiego zestawu τ punktów i wag, {t α, w α }, aby b l ad oszacowania, wyrażony jako kwadrat różnicy miedzy znana, analityczn wartości ca lki a jej przyblizeniem: [ τ 2 δ = e(t)dt w α e(t α )] (2.2) 0 by l możliwie jak najmniejszy dla zadanej, możliwie ma lej liczby punktów kwadratury. Wymaganie możliwie ma lej liczby punktów kwadratury wynika z faktu, że zastosowanie ca lko- 17 α=1

Rozdzia l 2. Implementacja 18 wania numerycznego wymaga wielokrotnego przeprowadzenia obliczeń zależnych od t. Dla każdego punktu kwadratury konieczne jest wygenerowanie macierzy pseudog estości (równ. 1.17-1.18), przeprowadzenie wst epnej selekcji, obliczenie ca lek dwuelektonowych, transformacja funkcji bazy (równ. 1.22-1.25) oraz obliczenie czastkowej poprawki do energii. Dlatego też odpowiedni dobór kwadratury jest kwesti kluczow dla możliwie szybkiego uzyskania wyników o odpowiedniej dok ladności. 2.1.1 Metoda najmniejszych kwadratów W 1992 roku Häser i Almlöf [11] zaproponowali minimalizacj e b l edu kwadratury za pomoc metody najmniejszych kwadratów. Dla dodatnich wartości różnicy energii orbitalnych z wyrażenia 1.6: x q = ɛ a + ɛ b ɛ i ɛ j (2.3) gdzie q jest zbiorczym indeksem dla orbitali molekularnych (ijab), możliwe jest przybliżenie funkcji 1/x q jako kombinacji liniowej funkcji wyk ladniczych: 1 = e xqt dt x q 0 τ w α e xqtα (2.4) α=1 Wyrażenie pozwalajace na minimalizacje b l edu kwadratury metod najmniejszych kwadratów ma postać: ( ) 1 τ 2 f q w α e xqtα = min! (2.5) q x q α=1 gdzie f q jest dyskretn funkcj rozk ladu gestości wspó lczynnika x q. Wad tego podejścia jest konieczność obliczenia czterokrotnej sumy po orbitalach molekularnych, w powyższym równaniu uj etej w postaci pojedynczej sumy po q. Häser i Almlöf [11] zaproponowali przejście z dyskretnego rozk ladu gestości f q na rozk lad ciag ly f(x) oraz zastapienie sumowania ca lkowaniem. Przedzia l ca lkowania można dobrać, wyznaczajac najmniejsz i najwieksz wartość różnic energii orbitali molekularnych (x q )i oznaczajac je odpowiednio x min i x max. Wyrażenie (2.5) przybiera postać: xmax x min f(x) [ ] 1 τ 2 x w α e xtα dx = min! (2.6) α=1

Rozdzia l 2. Implementacja 19 Optymaln kwadrature otrzymuje sie, szukajac ekstremum funkcji b l edu wzgledem zestawu punktów i wag kwadratury. W praktycznej implementacji do wyznaczenia zestawu punktów kwadratury użyto metody simpleksów, zaś do wyznaczenia zestwawu wag użyto standarodwych metod rozwiazywani uk ladów równań liniowych. Taka implementacja metody najmniejszych kwadratów ma jednakże istotne ograniczenie. Metoda ta pozwala na uzyskanie dok ladności rz edu µhartree już dla 5-8 punktów kwadratury. W zastosowaniach praktycznych jednakże cz esto pojawia si e konieczność uzyskania jeszcze wi ekszej dok ladności, ponadto dla uproszczenia wyznaczenia analitycznych wartości powyższych wyrażeń przyjmuje sie funkcje rozk ladu gestości f(x) jako sta l i równ jedności, co dodatkowo obniża dok ladność metody. Uzyskanie wyższej dok ladności wymaga jednakże użycia wi ekszej liczby punktów kwadratury, dla których przedstawiony powyżej algorytm staje si e źle uwarunkowany numerycznie. Dla zastosowań wymagajacych wiekszej dok ladności obliczeń konieczne by lo zatem wypracowanie innego podejścia do problemu. 2.1.2 Kwadratura Eulera-McLaurina W 1999 roku Ayala i Scuseria [12] zaproponowali użycie kwadratury Eulera-McLaurina do przeprowadzenia ca lkowania numerycznego. Stwierdzili oni, że ca lkowanie numeryczne funkcji z równ. 2.1, a wi ec funkcji wyk ladniczej, można zamienić na prostsze do wykonania ca lkowanie ma lo zmiennej funkcji. Zamiany takiej dokonuje sie poprzez odpowiednia transformacj e uk ladu wspó lrz ednych: E = 0 e(t)dt = 1 0 e(t) dt 1 dr dr = f(r)dr (2.7) 0 Transformacja zaproponowana przez Ayal e i Scuseri e [12] ma postać: t(r) = Kk a k r k (1 r) m (2.8) zaś wyrażenie na poprawk e do energii: E = 1 0 f(r)dr τ α f(r α )w α 1 [ τ ( ) k f + 12 ] τ + 1 α τ + 1 (f(0) + f(1)) (2.9)

Rozdzia l 2. Implementacja 20 Transformacja uk ladu zmieni la granice ca lkowania z nieskończonych na skończone. Dodatkowa korzyści jest fakt, że funkcja f(r) w przetransformowanym uk ladzie wspó lrz ed- nych jest stosunkowo ma lo zmienna w porównaniu z funkcj wyk ladnicza. W równaniu 2.9 wyrażenie 1/(τ + 1) pe lni rol e wagi, zaś wyrażenie k/(τ + 1) punktu kwadratury. G lownym problemem implementacji kwadratury Eulera-McLaurina jest wi ec dobór wartości wspó lczynników k, K, a k oraz m. Dla stabilności numerycznej algorytmu w okolicy punktu r = 0, należy dobrać wartość parametru m jako możliwie najmniejsza. Przeprowadzono szereg prób dok ladności kwadratury dla różnych wartości powyższych wspó lczynników. Za każdym razem porównywano wartość ca lki obliczonej numerycznie dla funkcji g(t) = e st z wartości ca lki wyznaczon analitycznie, równ 1/s. Wartość parametru s zawiera la sie w zakresie odpowiadajacym wartościom energii dla typowych obliczeń kwantowochemicznych: od 9 do 55 hartree. Nast epnie dobrano zestaw parametrów, dla którego wzgledny b l ad ca lkowania funkcji g(t) by l najmniejszy dla m = 2. Ponadto zdecydowano si e ograniczyć sum e z równania 2.8 do czterech wyrazów, od k = 3 do k = 6. Tak dobrany zestaw parametrów zosta l zaimplementowany w algorytmie. Obliczenia przeprowadzone dla wi ekszej liczby uk ladów wykaza ly, że zestaw ten okaza l si e bardzo dobrze przenośny na inne postaci parametru wspó lczynnika x w funkcji podca lkowej z równania 2.9. Parametry te s zatem odpowiednie dla przeprowadzania ca lkowania numerycznego metod Eulera-McLaurina dla wyrażeń na popawke do energii (równ. 2.1). 2.2 Struktury do przechowywania ca lek Ważnym aspektem implementacji wszystkich algorytmów obliczeniowych, obok ich skalowania czasowego, jest ich z lożoność pami eciowa. Duże zapotrzebowanie programu na pamieć operacyjn komputera przek lada sie na jego wydajność i czas trwania obliczeń. W przypadku ograniczonej ilości dost epnej pami eci operacyjnej konieczne jest zatem zastosowanie odpowiednich struktur danych pozwalajacych w wydajny i efektywny sposób dostosować przebieg algorytmu do ilości dost epnej pami eci operacyjnej. Formalizm kanonicznej metody MP2 wymaga obliczenia wartości ca lek dwuelektrono-

Rozdzia l 2. Implementacja 21 wych w bazie atomowej. Ca lki te nastepnie transformowane s do bazy orbitali molekularnych. Tensor ca lek dwuelektronowych w tej bazie jest struktur gest a; struktura taka umożliwia szybsze wykonywanie operacji algebraicznych, ale także ma wysokie zapotrzebowanie na pamieć operacyjn komputera. Fakt ten t lumaczy wysok z lożoność pamieciow metody MP2. W metodzie LT-AO MP2 procedura wstepnej selekcji eliminuje znaczac liczb e potrzebnych do obliczenia ca lek dwuelektronowych, w dodatku tensory ca lek dwuelektronowych w tej bazie s strukturami rzadkimi. Zastosowanie adekwatnych struktur danych do przechowywania tych ca lek w ciag lym obszarze pamieci umożliwia znaczace zmniejszenie ilości wymaganej pami eci operacyjnej oraz efektywniejsze wykonywanie operacji algebraicznych. Rysunek 2.1: Struktury danych do przechowywania przetransformowanych ca lek Struktura użyta do przechowywania wartości przetransformowanych ca lek dwuelektronowych zosta la schematycznie przedstawiona na rysunku 2.1. W strukturze tej można wyróżnić cztery poziomy, które odpowiadaj czterem indeksom ca lki dwuelektronowej. Pierw-

Rozdzia l 2. Implementacja 22 szy poziom drzewa tworzy pojedynczy wektor zawierajacy wskaźniki na miejsce w pamieci, w którym przechowywane s wektory kolejnego poziomu. Indeksy elementów tego wektora s jednocześnie indeksami pierwszych funkcji (µ) w ca lkach dwuelektronowych (µν λσ). Elementami wektorów drugiego poziomu s pary wartości; pierwsz wartości w parze jest indeks drugiej funkcji w ca lce (ν), zaś drug wartości jest odpowiadajacy temu indeksowi wskaźnik na miejsce w pami eci, w którym przechowywany jest wektor trzeciego poziomu, odpowiadajacy parze indeksów µν. Wektory trzeciego poziomu maj strukture analogiczna do struktury wektorów drugiego poziomu: w piewszych elementach w parzach przechowuja wartości trzecich indeksów ca lek (λ), zaś w drugich wskaźniki na wektory czwartego poziomu, odpowiadajace indeksom µνλ. Wektory czwartego poziomu również przechowuja pary wartości. Pierwsza z tych wartości przechowuje indeksy czwartych funkcji w ca lkach (σ), zaś drugie elementy w parze przechowuj wartości ca lek dwuelektronowych. Takie podejście do problemu umożliwia wydajne przechowywanie, wyszukiwanie i dodawanie nowych wartości. W drzewie przechowywane s wy l acznie ca lki o niezerowej wartości, co sprawia, że przechowywanie to wymaga mniejszej ilości pamieci operacyjnej. Szukajac wartości ca lki (αβ γδ) wystarczy odnaleźć w wektorze pierwszego poziomu pole o indeksie α. Wartość tego pola jest wskaźnikiem na wektor drugiego poziomu, w którym odnajdywany jest indeks β i bed ac z nim w parze wartość wskaźnika do wektora czwartego poziomu. W wektorze tym analogicznie odnajdowany jest indeks γ oraz wskaźnik do wektora czwartego poziomu, w którym po znalezieniu pola odpowiadajacego indeksowi δ odczytywana jest wartość ca lki. 2.3 Opis algorytmu Obliczenia metod LT-AO MP2 w zaimplementowanym algorytmie sk ladaj sie z kilku podstawowych etapów. 1. Obliczenie wartości punktów i wag kwadratury Eulera-McLaurina. Wyznaczany jest zestaw {t α, w α }, w zależności od podanej przez użytkownika liczby punktów kwadra-

Rozdzia l 2. Implementacja 23 tury. Wszystkie kolejne etapy algorytmu wykonywane s wielokrotnie i dla każdego punktu kwadratury obliczana jest czastkow poprawka do energii; poprawki te sa nast epnie sumowane celem wyznaczenia ostatecznej wartości. 2. Przygotowanie danych do transformacji ca lek i wstepnej selekcji. Wyznaczane sa macierze X i Y oraz macierze A, B, C i D. 3. Obliczenie ca lek w bazie atomowej. Ca lki atomowe przed obliczeniem poddawane sa procesowi wst epnej selekcji. Dla każdej ca lki szacowana jest jej wartość i jeśli okaże si e ona wi eksza od zadanej przez użytkownika wartości, ca lka zostaje obliczona. 4. Czterokrotna transformacja ca lek. Obliczone ca lki poddawane s pierwszemu etapowi transformacji i wartości przetransformowanych ca lek dodawane s do odpowiednich elementów drzewa. W nastepnych etapach ca lki po transformacji s przepisywane do nowych drzew. 5. Obliczenie czastkowej poprawki do energii od każdej ca lki oraz obliczenie sumarycznej wartości poprawki do energii. W przypadku metody LS-LT-AO MP2 wstepn selekcja za pomoc rozwinieci multipolowego wprowadza kilka dodatkowych etapów: 1. Wyznaczenie zasi egów dla pojedynczych funkcji bazy. Dla każdej funkcji bazy znajdowana jest taka odleg lość od punktu, na którym funkcja jest centrowana, dla której wartość funkcji jest mniejsza od zadanej wielkości, tożsamej z parametrem ε. 2. Wyznaczenie wspó lrz ednych środków dystrybucji ladunku oraz efektywnych zasi egów dla tych dystrybucji. Dla każdej pary funkcji tworzacych dystrybucje wyznaczany jest taki punkt pomiedzy atomami na których centrowane s funkcje tworzace dystrybucje, że promień sfery o środku w tym punkcie obejmujacej sfery wyznaczone przez zasi egi funkcji by l jak najmniejszy. 3. Wyznaczenie dla każdego punktu kwadratury środków oraz efektywnych zasi egów dystrybucji dla par przetransformowanych funkcji.

Rozdzia l 2. Implementacja 24 4. Wyznaczenie dla każdego punktu kwadratury wartości sferycznie uśrednionych momentów multipolowych dla dystrybucji ladunków. 5. Oszacowanie dla każdego punktu kwadratury oraz dla każdego etapu transformacji wartości ca lek dwuelektronowych za pomoc wartości sferycznie uśrednionych momentów multipolowych. Algorytm zosta l zaprojektowany tak, aby wykorzystywa l dostepn ilość pamieci operacyjnej w najbardziej wydajny sposób. W sytuacji, gdy ilość pami eci operacyjnej jest ograniczona, wykonywanie obliczeń odbywa si e nie w jednym, a kilku przebiegach. Pozwala to na zmniejszenie ilości jednocześnie transformowanych ca lek, co skutkuje mniejszym kosztem pami eciowym pojedynczego przebiegu. Wieloprzebiegowość zaimplementowanego algorytmu polega na podzieleniu zbioru ca lek koniecznych do przetransformowania na podzbiory i wykonaniu obliczeń dla każdego z tych podzbiorów po kolei. Rozmiar każdego z podzbiorów dobierany jest pod katem ilości dostep- nej pami eci operacyjnej oraz ilości ca lek do obliczenia. Podzia l na podzbiory dokonywany jest w pierwszym indeksie ca lek. Obliczenie wartości poprawki do energii dla pojedynczego punktu kwadratury można dla algorytmu wieloprzebiegowego wyrazić nastepuj aco: e = ( ) (µν λσ)[2(µν λσ) (µσ λν)] (2.10) µ νλσ Dla każdego punktu kwadratury zbiór pierwszych indeksów ca lek dzielony jest zatem na podzbiory i dla każdego z tych podzbiorów wykonywane s dalsze cześci algorytmu: przygotowanie danych do wst epnej selekcji, selekcja ca lek, obliczenie i transformacja pozosta lych ca lek oraz obliczenie czastkowej poprawki do energii.

Rozdzia l 3 Wyniki W celu potwierdzenia poprawności i zbadania efektywności zaimplementowanego algorytmu wykonano za jego pomoc obliczenia dla kilku wybranych uk ladów. Pierwszymi testowanymi uk ladami modelowymi by ly liniowe lańcuchy czasteczek wody po lożonych w odleg lości 2,5 Å od siebie. Mimo, że uk lady takie nie istniej a w rzeczywistości, zosta ly użyte do obliczeń, ponieważ najlepiej nadaj sie do ukazania zysku dotyczacego czasu obliczeń i z lożoności pami eciowej algorytmu. Wykonano także obliczenia dla bardziej realistycznych uk ladów, takich jak liniowe alkany i czasteczki zasad i par nukleotydowych. Obliczenia wykonywano w bazach STO-3G i 6-31G**. Baza STO-3G zosta la użyta celem przetestowania poprawności algorytmu, zaś bazy 6-31G** użyto do wykonania dok ladniejszych obliczeń dla bardziej realnych uk ladów. 3.1 Dok ladność Wartości b l edu wzglednego metody wyznaczano za pomoc wzoru: δ wzg = E kan E E kan (3.1) gdzie E kan jest wartości poprawki do energii uzyskan za pomoc kanonicznej metody MP2, zaś E jest wartości poprawki do energii obliczonej za pomoc testowanego algorytmu. 25

Rozdzia l 3. Wyniki 26 Rysunek 3.1: B l ad wzgledny metody dla liniowego lańcucha czasteczek wody, baza STO-3G Wykres 3.1 przedstawia wartość b l edu wzgl ednego metody w zależności od rozmiaru uk ladu. Testowanym uk ladem by l liniowy lańcuch czasteczek wody. Obliczenia wykonano w bazie STO-3G, dla 10 punktów kwadratury oraz dla wspó lczynnika obci ecia (wartość ε w równ. 1.39) równego 10 8. Wykres ukazuje, że wartość b l edu wzgl ednego metody LT-AO MP2 utrzymuje sie na w przybliżeniu sta lym poziomie, wynoszacym oko lo 10 5. Wartość b l edu metody LS-LT-AO MP2 systematycznie maleje wraz ze wzrostem rozmiaru uk ladu. Przyczyn tego jest niekonsekwencja procedury wstepnej selekcji opartej na nierówności Schwarza, polegajac na przeszacowywaniu wartości ca lek dla odleg lych od siebie dystrybucji ladunku (rozdzia l 1.3). Na wykresie 3.2 przedstawiono te sam zależność dla bazy 6-31G**. Ze wzgledu na koszt czasowy obliczeń kanonicznej metody MP2 ograniczono maksymaln d lugość lańcucha do 20 czasteczek wody. W tym przypadku b l ad wzgledny obu metod utrzymuje sie na w przybliżeniu sta lym poziomie.

Rozdzia l 3. Wyniki 27 Rysunek 3.2: B l ad wzgledny metody dla liniowego lańcucha czasteczek wody, baza 6-31G** Na wykresie 3.3 przedstawiono zależność wartości b l edu wzgl ednego metody od rozmiaru uk ladu dla czasteczek liniowych weglowodorów nasyconych. Obliczenia prowadzono w bazie 6-31G**, dla 10 punktów kwadratury oraz dla wspó lczynnika obci ecia 10 8. Wartości b l edu wzglednego zmieniaj sie wraz ze wzrostem liczby atomów wegl w czasteczce, jednakże dla czasteczek o 20 atomach wegl i d luższych, wartość b l edu wydaje sie systematycznie wzrastać. Z powodu rozmiaru bazy oraz dyskutowanej w poprzednich rozdzia lach z lożoności czasowej i obliczeniowej kanonicznej metody MP2, nie by lo możliwe uzyskanie w rozsadnym czasie wyników referencyjnych dla alkanów zawierajacych wiecej niż 30 atomów w egla w czasteczce. Tabela 3.1 przedstawia wartości b l edu wzglednego metody dla czasteczek zasad nukleotydowych. Obliczenia wykonywano w bazie 6-31G**, dla dwóch wartości wspó lczynnika obciecia, 10 8 i 10 10. B l ad wzgledny dla obu metod jest niewielki i ma wartość rzedu 10 3 dla wspó lczynnika obci ecia równego 10 8 oraz wartość rz edu 10 6 dla ε = 10 10. Wyko-

Rozdzia l 3. Wyniki 28 Rysunek 3.3: B l ad wzgledny dla liniowych alkanów, baza 6-31G** nano także obliczenia dla komplementarnych par zasad, dla których również otrzymano podobne wartości b l edu wzglednego. W niniejszej implementacji możliwa jest zmiana wartości parametru ε, co stwarza możliwość kontroli dok ladności metody. 3.2 Kontrola dok ladności Możliwość prostego i efektywnego kontrolowania dok ladności metody daje możliwość uzyskania badź to jedynie orientacyjnego wyniku w możliwie najkrótszym czasie, badź bardzo dok ladnego wyniku, bez wzgl edu na czas obliczeń. W zaimplementowanym algorytmie efekt ten osiagni eto, dajac użytkownikowi możliwość kontroli wartości dwóch parametrów metody: wspó lczynnika obci ecia (ε) oraz liczby punktów kwadratury (τ). W celu przedstawienia wp lywu tych parametrów na dok ladność obliczeń, wykonano

Rozdzia l 3. Wyniki 29 Tablica 3.1: B l ad wzgledny metody dla zasad i par nukleotydowych zasada b l ad wzgledny LT-AO MP2 LS-LT-AO MP2 ε = 10 8 ε = 10 10 ε = 10 8 ε = 10 10 adenina 1, 23 10 3 8, 51 10 6 1, 23 10 3 8, 91 10 6 cytozyna 2, 68 10 4 9, 60 10 6 2, 67 10 4 2, 89 10 6 guanina 1, 06 10 3 5, 58 10 6 1, 06 10 3 5, 55 10 6 tymina 7, 32 10 4 7, 12 10 6 7, 32 10 4 7, 12 10 6 a-t 2, 46 10 3 7, 16 10 6 2, 47 10 3 7, 43 10 6 c-g 7, 00 10 4 7, 90 10 6 4, 77 10 4 8, 24 10 6 obliczenia dla liniowego lańcucha czasteczek wody w bazie 6-31G**. Wykres 3.4 ukazuje zależność wartości b l edu wzgl ednego metody w zależności od wartości wspó lczynnika obci ecia. Obliczenia wykonywano dla sta lej liczby punktów kwadratury, równej 10. Wartość b l edu wzglednego dla ε równego 0 (co w praktyce oznacza wy l aczony algorytm wstepnej selekcji, czyli obliczenie i transformacj e wszystkich ca lek dwuelektronowych) przyj eto za wartość numerycznego b l edu kwadratury. Zgodnie z oczekiwaniami, zmniejszanie wartości wspó lczynnika obcieci znaczaco zmniejsza wartość b l edu wzglednego obu metod. Wykres 3.5 przedstawia wartość b l edu wzgl ednego metody dla tego samego uk ladu w funkcji liczby punktów kwadratury. Obliczenia wykonano w bazie 6-31G** dla sta lej wartości wspó lczynnika obci ecia, równej 10 8. Zwi ekszenie liczby punktów kwadratury oznacza zwiekszenie dok ladności ca lkowania numerycznego, co pociag za sob zmniejszenie b l edu wzgl ednego metody. Z analizy powyższych wykresów wynika, iż optymalnym zestawem parametrów, pozwalajacych na uzyskanie wyników z b l edem wzglednym rzedu 10 5, jest τ = 8 oraz ε = 10 8. Zależność b l edu wzgl ednego od liczby punktów kwadratury nie jest jednakże monotoniczna; obliczenia wykonane dla wiekszej grupy uk ladów pokazuja jednakże, że wymagan dok ladność uzyskuje sie dla τ = 10.

Rozdzia l 3. Wyniki 30 Rysunek 3.4: Zależność b l edu wzgl ednego metody od wspó lczynnika obci ecia 3.3 Z lożoność czasowa Czas obliczeń jest niezwykle ważnym parametrem opisujacym algorytm obliczeniowy chemii kwantowej. Jak już wielokrotnie wspomniano w tej pracy, z lożoność czasowa kanonicznej metody MP2 czyni j bezużyteczn dla dużych uk ladów molekularnych. Przeprowadzone obliczenia maj za zadanie dowieść, że zastosowanie opisanego w tej pracy formalizmu znaczaco redukuje czas obliczeń dla dużych uk ladów dzieki uwzglednieniu niezwykle dużej lokalności korelacji kulombowskiej. Obliczenia prowadzono w bazie STO-3G, dla 10 punktów kwadratury oraz dla wspó lczynnika obci ecia równego 10 8. Wykres 3.6 przedstawia zależność czasu obliczeń od rozmiaru uk ladu. Wykres ukazuje bardzo dobre skalowanie czasowe metody LT-AO MP2 - dla uk ladu zawierajacego 100 czasteczek wody, czas obliczeń dla tej metody dla obliczeń wykonywanych na procesorze Intel Xeon 2,33 GHz wynosi l 2 godziny i 33 minuty. Dla kontrastu, obliczenia kanoniczna

Rozdzia l 3. Wyniki 31 Rysunek 3.5: Zależność b l edu wzgl ednego od liczby punktów kwadratury metod MP2 dla tego samego uk ladu trwa ly ok. 9 dni. Wykresy dla kanonicznej metody MP2 i dla metod LS- i LT-AO MP2 przecinaj sie dla d lugości lańcucha ok. 25 czasteczek wody. Dla mniejszych uk ladów metoda MP2 dzia la szybciej. Jest to ilustracj faktu, że dla ma lych uk ladów zysk wynikajacy z zastosowania wstepnej selekcji jest znikomy, a szybkość obliczeń limitowana jest przez koszt czasowy operacji algebraicznych na strukturach danych zastosowanych w metodach LS- i LT-AO MP2. Dla metody LS-LT-AO MP2 nie uda lo si e uzyskać liniowego skalowania czasowego. Dla każdego z testowanych uk ladów czas obliczeń by l nieznacznie d luższy niż czas dla metody LT-AO MP2. Koszt czasowy algorytmu szacowania ca lek dwuelektronowych za pomoca rozwini ecia multipolowego wydaje si e zatem nie być rekompensowany przez skrócony przez niego czas obliczania i transformacji ca lek. Szacowanie takie pozwala jednakże na osiagni e- cie liniowego skalowania pami eciowego, o którym b edzie mowa w nast epnym podrozdziale. Na wykresie 3.7 przedstawiono zależność czasu obliczeń od rozmiaru uk ladu dla obliczeń

Rozdzia l 3. Wyniki 32 Rysunek 3.6: Czas obliczeń dla liniowego lańcucha wody, baza STO-3G wykonanych w bazie 6-31G**. Dla tej bazy przewaga zaimplementowanej metody nad kanoniczn metod MP2 ujawnia sie już dla lańcucha 20 czasteczek wody. Na wykresie 3.8 przedstawiono czas obliczeń dla liniowych w eglowodorów (baza 6-31G**, ε = 10 8, τ = 10) w zależności od liczby atomów wegl w czasteczce. Z analizy wykresu wynika, że dla testowanych czasteczek nie uda lo sie osiagn ać zysku czasowego. Można to wyt lumaczyć rozmiarami uk ladu. D lugość wiazani wegiel-w egiel wynosi ok. 1,45 Å, zaś odleg lość miedzy atomami tlenu w lańcuchu czasteczek wody ok. 2,5 Å, tak wiec najwiek- sze czasteczki weglowodorów, dla których przeprowadzono obliczenia (30 atomów wegl w czasteczce), mia ly rozmiary odpowiadajace w przybliżeniu lańcuchowi sk ladaj acemu sie z 15 czasteczek wody. Jednocześnie czasteczki weglowodorów zawieraj wiecej atomów na jednostk e odleg lości, niż liniowe lańcuchy wody. Fakt ten t lumaczy także gorsze skalowanie czasowe metody LT-AO MP2 dla tych uk ladów. Mniejsze przestrzennie czasteczki weglo- wodorów zawieraj jednocześnie wiecej atomów w porównaniu z lańcuchami wody, a to

Rozdzia l 3. Wyniki 33 Rysunek 3.7: Skalowanie czasowe dla liniowego lańcucha wody, baza 6-31G** oznacza wieksz ilość ca lek dwuelektronowych koniecznych do obliczenia. Ze wzgledu na duż liczbe ca lek dwueletronowych koniecznych do wyznaczenia nie by lo możliwe wykonanie obliczeń kanoniczn metod MP2 dla weglowodorów posiadajacych wiecej niż 30 atomów wegl w czasteczce celem uzyskania wyników referencyjnych. Zysk czasowy może jednakże ujawnić si e dla jeszcze wi ekszych uk ladów. Z analizy wykresu wynika, że zysk czasowy metod LS- i LT-AO MP2 ujawnia sie dla czasteczek zawierajacych wiecej niż 40 atomów w egla. Dopasowujac linie trendu dla wykresu zależności logarytmu z czasu obliczeń od logarytmu z wielkości opisujacej rozmiar uk ladu, można wyznaczyć efektywn wartość wspó lczynnika skalowania czasowego metody m (O(N m )). W tabeli 3.2 zebrano wartości tych wspó lczynników dla testowanych uk ladów. Skalowanie czasowe kanonicznej metody MP2 jest zgodne z przewidywaniami; metoda ta skaluje si e w przybliżeniu jak O(N 5 ). Skalowanie czasowe metody LT-AO MP2 jest o ponad 2 rz edy wielkości lepsze niż w przypadku stan-

Rozdzia l 3. Wyniki 34 Rysunek 3.8: Czas obliczeń metody dla liniowych w eglowodorów dardowej metody MP2. Metoda LT-AO MP2 nie osiag teoretycznego limitu skalowania czasowego. Fakt ten można wyt lumaczyć tym, że kwadratowe skalowanie metody osiagane jest asymptotycznie, dla nieskończenie dużych uk ladów oraz dla nieskończenie dużej pamieci operacyjnej. Zmniejszenie z lożoności czasowej o ponad dwa rzedy jest jednakże duża popraw wydajności w stosunku do metody MP2. Dla czasteczek weglowodorów do wyznaczenia wspó lczynnika skalowania czasowego użyto wyników dla czterech czasteczek - zawierajacych 15, 20, 30 i 40 atomów wegl (wyjat- kiem jest metoda MP2, dla której nie otrzymano w rozsadnym czasie wyniku dla czasteczki zawierajacej 40 atomów wegla). By lo to spowodowane faktem, że dla ma lych czasteczek istnieje wiele czynników, które nie uwidaczniaj sie dla wiekszych, ale wp lywaj na czas obliczeń dla ma lych uk ladów. Przyk ladem tego jest wynik dla pentanu na wykresie 3.8, który odbiega od liniowego trendu wyznaczonego przez wyniki dla wiekszych czasteczek.

Rozdzia l 3. Wyniki 35 Tablica 3.2: Wartości wspó lczynników skalowania czasowego metody uk lad wspó lczynnik skalowania czasowego MP2 LT-AO MP2 LS-LT-AO MP2 liniowe lańcuchy wody, baza STO-3G 5,54 2,81 2,85 liniowe lańcuchy wody, baza 6-31G** 5,44 2,60 2,73 liniowe weglowodory, baza 6-31G** 4,88 2,46 2,64 3.4 Z lożoność pami eciowa Drugim ważnym parametrem każdej numerycznej metody obliczeniowej jest jej z lożoność pamieciowa. W przypadku metod obliczeniowych chemii etapem wymagajacym najwi ekszej ilości pami eci operacyjnej jest obliczenie, ewentualna transformacja oraz przechowywanie ca lek dwuelektronowych. Dla dużych uk ladów molekularnych z lożoność pami e- ciowa algorytmu, obok jego z lożoności czasowej, może uniemożliwiać wykonywanie obliczeń dla wiekszych uk ladów, co znaczaco ogranicza jego stosowalność. Aby opisać z lożoność pamieciow algorytmu, dla każdej z metod wyznaczono liczbe koniecznych do obliczenia ca lek dwuelektronowych. W przypadku metod LT- oraz LS- LT-AO MP2 liczbe ca lek wyznaczano, biorac liczbe ca lek do policzenia w drugim kroku transformacji, ponieważ ten krok ma dominujacy koszt pamieciowy w tej metodzie. Wykres 3.9 przedstawia zależność tej liczby ca lek od rozmiaru uk ladu. Testowanym uk ladem by l liniowy lańcuch 10 czasteczek wody. Obliczenia wykonywano w bazach STO-3G oraz 6-31G** dla τ = 10 oraz ε = 10 8. Z analizy wykresu wynika, że zastosowanie struktur danych opisywanych w tej pracy redukuje z lożoność pamieciow algorytmu do liniowej. Liczba ca lek dwuelektronowych koniecznych do obliczenia na drugim etapie transformacji drastycznie spada po zastosowaniu algorytmu LT- i LS-LT-AO MP2, co znaczaco podnosi wydajność algorytmu. Z po lożenia punktu przeci ecia wykresów można wnioskować, że zysk dotyczacy z lożoności pamieciowej uzyskuje sie już dla lańcucha 15 czasteczek wody. Wykres 3.10 przedstawia skalowanie pami eciowe metody dla tego samego uk ladu w bazie 6-31G**. Wyniki dla tej bazy s jakościowo zgodne z wynikami dla bazy STO-3G.