Modelowanie układów złożonych ze znacznej liczby atomów lub cząsteczek Eksperyment komputerowy (symulacja komputerowa) Warunki prowadzenia symulacji Wybrane metody modelowania Monte Carlo Dynamika Molekularna Dynamika Stochastyczna 1
Gdzie stosujemy Modelowanie komputerowe Przewidywanie właściwości cieczy, roztworów, ciał stałych Badanie złożonych procesów, jak np. adsorpcja cząsteczek na powierzchni Zachowanie się makrocząsteczek (rozpoznawanie molekularne, kataliza enzymatyczna, projektowanie leków, badanie zmian konformacyjnych, zwijanie białek) Ewolucja czasowa układu cząsteczek czy atomów (badanie dynamiki i termodynamiki układu, oddziaływań międzycząsteczkowych, samoorganizacji molekularnej) Pomocniczo przy eksperymentalnym określaniu struktury białek - rentgenografia strukturalna 2
Eksperyment komputerowy (symulacja komputerowa) jako metoda rozwiązywania zagadnień z dziedziny mechaniki statystycznej i fizyki układów skondensowanych narodził się w połowie lat pięćdziesiątych XX wieku. Był to również początek ery maszyn liczących. Metody symulacyjne mają charakter wybitnie numeryczny i skala zagadnienia, które możemy przy ich pomocy rozwiązać, zależy w głównej mierze od jakości dostępnych komputerów. 3
Kamieniem węgielnym dla metod symulacyjnych była praca Metropolisa i in. Obliczenia równań stanu na szybkich maszynach liczących opublikowana w 1953 r. W pracy tej sformułowano dwie ważne do dzisiaj zasady prowadzenia symulacji: Periodyczne warunki brzegowe Zasadę efektywnego wyboru równowagowych konfiguracji cząsteczek w symulowanym układzie importance sampling Opracowana metoda została przez autorów użyta do numerycznego obliczenia równania stanu dla 2-wymiarowego układu, zawierającego 224 atomy. Obliczenia przeprowadzono na maszynie liczącej MANIAC w laboratorium w Los Alamos (maszyna ustępowała dzisiejszym programowalnym kalkulatorom!!) 4
Metodyka eksperymentu komputerowego polega na wykorzystaniu algorytmów numerycznych do przewidywania własności bardzo precyzyjnie zdefiniowanych systemów modelowych Informacje uzyskane za pomocą symulacji komputerowej są informacjami ścisłymi w stosunku do systemu modelowego. Ich odniesienie do rzeczywistości zależy jedynie od tego, w jakim stopniu zdefiniowany przez nas układ modelowy przypomina badany system rzeczywisty. Eksperyment komputerowy stał się w obecnej chwili trzecią równoprawną metodyką badawczą obok eksperymentu laboratoryjnego i badań teoretycznych. 5
wykonanie modelu wykonanie eksperymentu przeprowadzenie symulacji komputerowej przyblizone modele teoretyczne porównanie porównanie 6
Badania teoretyczne + często dostarczają rozwiązań analitycznych rzadko kiedy mają rozwiązania ścisłe (bo to trudne) a zastosowane przybliżenia obniżają np. zakres stosowania uzyskanych wzorów + rozwiązanie ma charakter dość ogólny Symulacje + są ścisłe na poziomie modelu brak ogólności rozwiązanie dotyczy tylko konkretnego symulowanego układu (tak jak eksperyment laboratoryjny!) 7
Metody Symulacji Komputerowej Układów Skondensowanych metoda Monte Carlo metoda Dynamiki Molekularnej, MD metody Dynamiki Stochastycznej, SD metody Symulacji Kwantowych, QM 8
Metody Symulacji komputerowej wymagają : 1. zdefiniowania potencjałów oddziaływania między cząstkami układu 2. ograniczenia liczebności układu do kilkuset cząstek wybór komórki podstawowej wybór periodycznych warunków brzegowych sposób obliczania oddziaływań bliskiego zasięgu sposób obliczania oddziaływań dalekiego zasięgu 3. określenia algorytmu ruchu cząstek 9
1.Potencjały oddziaływania to pole siłowe 2.Ograniczenie liczebności (przyczyna czasochłonność obliczeń) układ zamyka się w bryle zwanej komórką podstawową najczęściej jest to sześcian daje to niekorzystne konsekwencje jakie? W niewielkim układzie istotną rolę odgrywają efekty powierzchniowe. Jego własności różnią się zatem od własności układu makroskopowego, w którym liczba cząsteczek jest rzędu stałej Avogadro. sześcian graniastosłup sześciokątny ośmiościan ścięty dwunastościan rombowy Aby wyeliminować efekty powierzchniowe, nie zwiększając rozmiarów próbki, na układ nakłada się tzw. periodyczne warunki brzegowe oraz stosuje się specjalne algorytmy obliczania oddziaływań międzycząsteczkami 10
periodyczne warunki brzegowe Polegają one na tym, że komórkę podstawową replikuje się periodycznie w przestrzeni we wszystkich kierunkach. Przemieszczenia cząsteczek w komórce podstawowej są niezależne, natomiast cząsteczki w pozostałych komórkach przemieszczają się tak samo jak cząsteczki komórki podstawowej. W ramach tego ograniczenia jest jednak możliwe swobodne przechodzenie cząsteczek z jednej komórki do drugiej. 11
periodyczne warunki brzegowe (ilustracja dwu-wymiarowa) Kwadrat, oznaczony ciemniejszym kolorem odpowiada komórce podstawowej. Jest on otoczony nieskończoną siecią identycznych kwadratów A, B,..., z których każdy zawiera tę samą liczbę N cząsteczek w identycznej konfiguracji. Jeżeli w czasie ruchu któraś z cząsteczek opuszcza komórkę podstawową, jak np. cząsteczka opatrzona numerem 1, to równocześnie przeciwległy bok tej komórki przekracza cząsteczka 1 G, która poprzednio była w kwadracie G. 12
Obliczając energię potencjalną symulowanego układu należy uwzględnić oddziaływania każdej cząsteczki j z każdą inną cząsteczką i komórki podstawowej oraz ze wszystkimi obrazami i A, i B,... cząsteczki i, znajdującymi się w sąsiednich komórkach. W praktyce dla potencjałów krótkiego zasięgu liczbę oddziaływań każdej cząsteczki ogranicza się zgodnie z tzw. regułą najbliższego obrazu (ang. minimum image convention). W myśl tej reguły każda cząsteczka oddziałuje jedynie z najbliższymi w stosunku do niej obrazami periodycznymi N -1 cząsteczek układu. 13
Dodatkowe zmniejszenie liczby rozpatrywanych oddziaływań krótko-zasięgowych w układzie uzyskuje się poprzez wprowadzenie tzw. promienia odcięcia r c i pominięcie oddziaływań pomiędzy cząsteczkami odległymi od siebie o r > r c Zwykle jako r c przyjmuje się połowę długości boku pudełka symulacyjnego. 14
reguła najbliższego obrazu (ilustracja dwu-wymiarowa) Komórka podstawowa zawiera 5 cząsteczek. Komórka, oznaczona linią przerywaną również zawiera 5 cząsteczek, jednak została ona skonstruowana w taki sposób, aby cząsteczka 1 znalazła się w jej środku. Cząsteczka ta oddziałuje z cząsteczkami 2, 3E, 4E i 5C. Kryterium wyboru jest najkrótsza odległość między oddziałującymi partnerami. Okrąg, zaznaczony linią przerywaną (o promieniu r c ) to granica obszaru odcięcia dla oddziaływań krótko-zasięgowych. 15
oddziaływania dalekiego zasięgu to oddziaływania, które zanikają wolniej niż Ich energia jest dość wysoka a zakres jest często większy niż r c 1 r Największy problem stanowią oddziaływania ładunek-ładunek zanikają one jak!! a są bardzo istotne w symulacjach np. 3 stopionych soli procesów zachodzących w ciałach stałych i na ich powierzchni przy obliczaniu pewnych wielkości, np. przenikalności elektrycznej błon komórkowych, białek, DNA 1 r 16
oddziaływania dalekiego zasięgu Jak uwzględnić te oddziaływania w symulacjach? można zwiększyć rozmiary pudełka symulacyjnego niepraktyczne! dla układu o dwukrotnie większej liczbie atomów rośnie czterokrotnie liczba oddziaływań daleko-zasięgowych zastosować np. technikę Ewalda sumowania energii tych oddziaływań (tak jakby periodyczne obrazy komórki podstawowej tworzyły nieskończoną sieć krystaliczną) zastosować metodę multipoli komórkowych 17
3. Określenie algorytmu ruchu cząsteczek jest on specyficzny dla stosowanej metody symulacji Rozpoczynając symulację układu musimy założyć pewną wyjściową konfigurację cząsteczek. Konfiguracja ta może być dowolna, gdyż jej wybór nie wpływa na wyniki symulacji. Może to być np. uporządkowanie krystaliczne lub rozmieszczenie uzyskane w wyniku minimalizacji energii układu cząsteczek 18
3. Określenie algorytmu ruchu cząsteczek W pierwszym etapie symulacji układ dochodzi do stanu równowagi, tzn. zapomina o swojej początkowej strukturze a jego energia zaczyna podlegać niewielkim fluktuacjom wokół wartości średniej. Kolejne kroki symulacji służą do skompletowania zbioru kilkuset równowagowych konfiguracji molekularnych, które są wykorzystywane w dalszych obliczeniach. 19
20
Metoda Monte Carlo (MC) 1.nową konfigurację układu uzyskujemy w wyniku losowego ruchu pojedynczego atomu lub cząsteczki 2. liczymy różnicę energii potencjalnej między nową a starą konfiguracją U 3. nowa konfiguracja jest akceptowana, jeśli jej energia jest niższa od energii konfiguracji poprzedniej, tzn. gdy U < 0 4. jeśli energia nowej konfiguracji jest wyższa od energii starej konfiguracji, to wtedy obliczamy U / kt czynnik Boltzmanna e oraz generujemy liczbę losowa [0,1] i porównujemy ją z czynnikiem Boltzmanna U / kt 5. gdy czynnik Boltzmanna jest większy niż to nową konfigurację akceptujemy i 0 wraz z nią przechodzimy do punktu 1. 6. w przeciwnym przypadku nową konfigurację odrzucamy i do punktu 1. przechodzimy ponownie ze starą konfiguracją zasada importance sampling e 21 U
Metoda Monte Carlo (MC) Interesuje nas właściwość A rozważanego układu, np. jego pojemność cieplna Z eksperymentu laboratoryjnego znamy wartość średnią tej własności <A> Symulacja Monte Carlo też służy do określenia wartości średniej A Jak? Dla każdej z M zaakceptowanych równowagowych konfiguracji układu obliczamy wartość mikroskopową A(r (N) ) zależy ona od współrzędnych r (N) wszystkich cząsteczek układu a następnie bierzemy średnią arytmetyczną tych obliczonych wartości, czyli M 1 ( N ) A A( r ) M w praktyce M jest rzędu kilku lub kilkudziesięciu milionów (im większe M, tym mniejszy błąd statystyczny uzyskanego wyniku) i 1 jest to średnia po konfiguracjach Czas nie występuje w symulacji Monte Carlo! 22
23
Metoda Dynamiki Molekularnej (MD) jeśli w chwili t 0 położenia i prędkości cząstek układu określa N wektorów r ( t 0 ) i t ) i u i ( 0 to w czasie późniejszym o t nowe położenia i prędkości cząstek wyznaczamy poprzez numeryczne całkowanie układu N klasycznych równań ruchu Newtona (po jednym dla każdej cząstki) siłę działającą na każdą cząstkę określa ujemna pochodna energii potencjalnej tej cząstki krok czasowy symulacji t jest zwykle rzędu kilku femtosekund 24
Metoda Dynamiki Molekularnej (MD) doprowadzenie układu do stanu równowagi wymaga kilku tysięcy kroków czasowych zebrany zbiór konfiguracji równowagowych powinien zawierać kilkadziesiąt tysięcy konfiguracji (M) odległych od siebie o kilka kroków czasowych wartość średnią <A> właściwości A w metodzie MD obliczamy poprzez uśrednienie odpowiednich wartości mikroskopowych A względem czasu!! Uwaga! A 1 M i M 1 A( r Udowadnia się, że uśrednianie po czasie jest równoważne uśrednianiu po konfiguracjach, czyli wyniki MD i MC są równoważne. ( N ), u ( N ) ) 25
porównanie metod: dynamika molekularna bada jak zmieniają się w czasie właściwości układu metoda deterministyczna można odtworzyć konfigurację układu w dowolnym czasie w przyszłości oraz w przeszłości energia kinetyczna jest włączona do całkowitej energii układu tradycyjnie rozważamy układy o stałej liczbie cząsteczek N, objętości V i energii E Monte Carlo brak zależności czasowej między generowanymi konfiguracjami metoda losowa -- konfiguracja następna zależy jedynie od konfiguracji poprzedniej energia układu jest określona tylko przez jego energię potencjalną tradycyjnie rozważamy układy o stałych N, V i temperaturze T 26
Metoda Dynamiki Stochastycznej (SD) może być stosowana wszędzie tam, gdzie klasyczna MD jest zbyt kosztowna, tzn. wymaga zbyt dużej pamięci i szybkości komputerów. Typowy przykład: układy, w których zachodzą procesy o różnych skalach czasowych, np. interesuje nas dynamika dużej molekuły białka w roztworze wodnym Mamy tu: procesy szybkie, związane głównie z ruchami cząsteczek wody i powolne, związane ze zmianami konformacji cząsteczki białka 27
Metoda Dynamiki Stochastycznej (SD) Jakie t zastosować przy całkowaniu równań ruchu dla całego układu? ze względu na dynamikę wody t bardzo krótkie ale wtedy poznanie dynamiki białka wymaga bardzo długiej symulacji kłopoty techniczne! ze względu na dynamikę cząsteczki białka t duże ale co wtedy z dynamiką cząsteczek wody? rada pomijamy w symulacji szczegółowy opis cząsteczek wody a wpływ rozpuszczalnika zastępujemy pewną siłą stochastyczną + siłą mikroskopowego tarcia A zatem 28
opisuje ewolucję w czasie pędów i położeń istotnej dla nas części badanego układu 29
Wyniki symulacji wielkości strukturalne radialne funkcje rozkładu liczby koordynacyjne wielkości dynamiczne funkcje autokorelacyjne ruchliwości cząstek współczynniki dyfuzji cząstek widma drgań molekularnych wielkości termodynamiczne temperatura ciśnienie wielkości związane z fluktuacjami energii (ciepła właściwe c v i c p, współczynnik rozszerzalności termicznej) 30
radialna funkcja rozkładu Wyniki symulacji radialne funkcje rozkładu g(r) odległości między cząsteczkami lub poszczególnymi atomami cząsteczek g(r) dostarczają cennych informacji na temat krótko-zasięgowego uporządkowania ośrodka, średniej liczby koordynacyjnej n(r) cząsteczek, ich wzajemnej orientacji, wiązań wodorowych, itp. r 1 r 2 odległość [Å] r 31
radialna funkcja rozkładu np. Wyniki symulacji symulujemy roztwór wodny NaCl kolejne maksima funkcji g(r) dla Na + - woda odpowiadają promieniom kolejnych warstw hydratacyjnych jonu Na + całkując g(r) po kuli o promieniu r liczbę n(r) cząstek zawartych wewnątrz tej kuli g(r) r 1 Na + jest w punkcie (0,0) r 2 odległość [Å] r całkując g(r) w zakresie pokazanym na rysunku n( r) tworzy pierwszą warstwę hydratacyjną jonu Na + ρ gęstość liczbowa ośrodka r 2 4 g( r) r r 1 2 dr ile cząstek 32
Eksperymentalną g(r) można otrzymać techniką rentgenografii strukturalnej A tak na marginesie Metoda rentgenografii strukturalnej umożliwiła m.in. wyznaczenie dokładnej struktury mioglobiny przez Maxa Perutza i Johna Cowdery Kendrewa w 1958, za co otrzymali oni Nagrodę Nobla (w roku 1962). Technika ta odegrała też decydującą rolę w ustaleniu struktury podwójnej helisy DNA przez Rosalindę Franklin, Jamesa Watsona i Francisa Cricka. mioglobina 33
Symulacje dynamiki molekularnej można prowadzić w różnych zespołach statystycznych: mikrokanonicznym (stałe: N, V, E) kanonicznym (stałe: N, V, T) izotermiczno-izobarycznym (stałe: N, P, T) wielkim zespole kanonicznym (stałe: μ, V, T) W czasie symulacji (czasy rzędu nano- lub nawet mikro-sekund) można zbierać dane o energii całkowitej, kinetycznej, potencjalnej, zapamiętywać położenia i prędkości atomów. Możemy zatem przeszukiwać przestrzeń konformacyjną cząsteczek. 34
uwagi końcowe periodyczne warunki brzegowe nie są stosowane w symulacjach, np. kropelki cieczy klastera van der Waalsa układów niehomogenicznych czy też nierównowagowych makrocząsteczek np. białek czy też kompleksów białka z naturalnymi ligandami W realistycznych symulacjach biochemicznych musimy jednak uwzględnić rozpuszczalnik, tzn. wodę. Zwykle biomolekułę otacza się warstwą cząsteczek wody. Są to duże układy. np: mały enzym o ok. 2500 atomach otoczony warstwą wody o grubości 10 Å to 14700 atomów redukując warstwę wody do 5 Å mamy 8900 atomów ale taki sam enzym w sześcianie z wodą o boku 10 Å to niemal 20000 35 atomów
uwagi końcowe Czasem interesuje nas tylko część cząsteczki (np. miejsce aktywne enzymu). Wtedy dzielimy układ na dwa obszary : jeden to strefa reakcji zawiera atomy w promieniu R 1 od miejsca aktywnego tu prowadzi się pełną symulację, obszar drugi to rezerwuar zawiera atomy na zewnątrz strefy reakcji ale wewnątrz kuli o promieniu R 2, dalsze atomy są na ogół pomijane lub przywiązywane do miejsca w którym występują to są tzw. stochastyczne warunki brzegowe 36
Dynamika Molekularna umożliwia symulację zachowania (ruchu) cząsteczek w czasie, np. ruchy Browna, zderzenia sprężyste cząsteczek przemiany konformacyjne, zwijanie białek termodynamika (własności układu w równowadze) zjawiska solwatacji pełna analiza dróg reakcji chemicznych mechanizm katalizy, polimeryzacji procesy fizykochemiczne: transport przez membrany, krystalizacja/topnienie, zeszklenie/mięknięcie polimerów, oddziaływanie z powierzchnią międzyfazową, samoorganizacja cząsteczek, tworzenie miceli 37
solwatacja jonów Na + Cl - w wodzie przeniesienie protonu HOH H + -OH 2 zderzenie sprężyste dwóch cząsteczek fullerenu C 60 w 500 K 38
statyczne modelowanie molekularne Fragment DNA (12 par nukleotydów, 760 atomów) 39
dynamika molekularna Fragment DNA (12 par nukleotydów, 760 atomów) 40
Symulacja samoorganizacji kopolimerów blokowych w nanoskali (10 nm) synteza nanowarstw; poczwórna warstwa kopolimeru w wodzie brąz blok hydrofilowy zieleń blok hydrofobowy fiolet powierzchnia międzyfazowa między blokami 41
transport przez membrany Błona komórkowa akwaporyna-1 (AQP-1) nieb. akwagliceroporyna ziel. i żółty dwuwarstwa lipidowa (100000 atomów) 42
modelowanie molekularne - oprogramowanie Gaussian (ab initio, semiemp., MM) Hyperchem (ab initio, semiemp.,mm) ADF, Turbomole (DFT) Jaguar (ab initio, DFT) Spartan - (ab initio, semiempiryka, MM) Accelrys Discovery + Materials Studio (ab initio, semiempiryka, MM, MD) Schrödinger (ab initio, MM, MD) Amber (MD, QM/MM) programy komercyjne 43
modelowanie molekularne - oprogramowanie Gamess, PCGamess, NWchem (ab initio) Mopac (semiempiryka) Tinker (MM) Ascalaph (QM, MM, MD) DL_Poly (MD polimerów) Gromacs, cpmd, cp2k (MD) NAMD, VMD (MD) 44
ciekawostka numeryczne obliczanie wartości całki z funkcji f(x,y) metodą trapezów alternatywa to metoda losowa, czyli Monte Carlo: generujemy pary liczb losowych (x,y) odpowiadające punktom leżącym w prostokącie A calka N punktów ( x, y) pod wykresem f ( x, y) N wszystkich punktów ( x, y) ( pole A) A B 45