Modelowanie molekularne metodami chemii kwantowej Dr hab. Artur Michalak Zakład Chemii Teoretycznej Wydział Chemii UJ Wykład 5 http://www.chemia.uj.edu.pl/~michalak/mmod2007/
Podstawowe idee i metody chemii kwantowej: Funkcja falowa, gęstość elektronowa; równanie Schrodingera; Teoria Funkcjonałów Gęstości (DFT); przyblienie Borna-Oppenheimera, zasada wariacyjna w mechanice kwantowej i w DFT, przyblienie jednoelektronowe; metoda HF; korelacja elektronowa; metody korelacyjne oparte na funkcji falowej; metoda Kohna-Shama Dane do obliczeń kwantowo-chemicznych; GAMESS: Geometria czasteczki; macierz Z; bazy funkcyjne w obliczeniach ab initio ; input/output programu GAMESS Struktura geometryczna układów molekularnych: Optymalizacja geometrii; optymalizacja z wiazami; analiza konformacyjna; problem minimum globalnego Struktura elektronowa układów molekularnych: Orbitale molekularne, orbitale KS; wiazanie chemiczne; gęstość rónicowa; orbitale zlokalizowane; analiza populacyjna; analiza rzędów wiązań Analiza wibracyjna; Wielkości termodynamiczne; Reaktywność chemiczna: Analiza wibracyjna; wielkosci termodynamiczne; modelowanie reakcji chemicznych; optymalizacja geometrii stanu przejściowego, IRC; indeksy reaktywności chemicznej, molekularny potencjał elektrostatyczny, funkcja Fukui ego i teoria orbitali granicznych; jedno- i dwu-reagentowe indeksy reaktywności Inne zagadnienia: Metody hybrydowe QM/MM; modelowanie wielkich układów; efety rozpuszczalnika; modelowanie w katalizie homo- i heterogenicznej; oddziaływania międzycząsteczkowe, i. in.
Przybliżenie adiabatyczne i Borna-Oppenheimera TS TS Punkty charakterystyczne na PES: -minima odpowiadają geometriom równowagowym (substraty, produkty reakcji chemicznych); - punkty siodłowe stany przejściowe (TS) reakcji chemicznych Ścieżki reakcji chemicznej krzywe na PES łączące substraty i produkty reakcji poprzez odpowiedni TS
Poszukiwanie minimum na PES
Analiza konformacyjna
GAMESS - wybór współrzędnych dla optymalizacji grupa $CNTRL: zmienna NZVAR=n, gdzie n=ilość współrzędnych wewnętrznych wymusza optymalizację we we współrzędnych wewnętrznych: jeśli COORDS=ZMT, ZMTMPC --współrzędne z $DATA jeśli COORDS= inne --współrzędne w grupie $ZMAT Domyślnie: optymalizacja we we współrzędnych kartezjańskich (NZVAR=0)
Analiza konformacyjna n-butanu E [kcal/mol] CH 3 CH 2 ----CH 2 CH 3 RHF/3-21G 12 CH 3 10 CH 3 H 3 C CH 3 8 CH 3 CH 3 6 4 2 CH 3 CH 3 0-180 -150-120 -90-60 -30 0 30 60 90 120 150 180 kąt torsyjny
Analiza konformacyjna n-butanu E [kcal/mol] CH 3 CH 2 ----CH 2 CH 3 Pełna optymalizacja geometrii RHF/3-21G dla punktów na zboczach doprowazi do znaleziema minimów. 12 10 CH 3 CH 3 H 3 C CH 8 3 CH 3 CH 3 6 4 2 CH 3 CH 3 0-180 -150-120 -90-60 -30 0 30 60 90 120 150 180 kąt torsyjny
Analiza konformacyjna n-butanu E [kcal/mol] 12 10 8 6 4 2 Wymagana jest optymalizacja RHF/3-21G z więzami, tj. dla każdej wartosci kata torsyjnego - optymalizacja pozstałych współrzędnych, poza tym kątem torsyjnym CH 3 CH 3 CH 3 CH 2 ----CH 2 CH 3 H 3 C CH 3 0-180 -150-120 -90-60 -30 0 30 60 90 120 150 180 kąt torsyjny CH 3 CH 3 CH 3 CH 3
Optymalizacja geometrii z więzami grupa $CNTRL: Program GAMESS: -zmienna NZVAR=n, gdzie n=ilość współrzędnych wewnętrznych wymusza optymalizację we współrzędnych wewnętrznych - grupa $STATPT: Słowo kluczowe IFREEZ(1)=n,m,k...; gdzie n,m,k numer kolejny elementu macierzy Z - zamraża współrzędne n,m,k, itd..
Program GAMESS przykładowy input $CONTRL SCFTYP=RHF RUNTYP=OPTIMIZE COORD=ZMT NZVAR=3 $END $SYSTEM TIMLIM=2 MEMORY=100000 $END $STATPT OPTTOL=1.0E-5 IFREEZ(1)= 3 $END $BASIS GBASIS=STO NGAUSS=2 $END $GUESS GUESS=HUCKEL $END $DATA Methylene...1-A-1 state...rhf/sto-2g Cnv 2 C H 1 rch H 1 rch 2 ahch rch=1.09 ahch=110.0 $END zamrożenie trzeciej z kolei współrzędnej wewnętrznej, czyli kąta HCH
Wykonanie obliczeń dla szeregu punktów odpowiadającym różnym wartościom wybranego kąta torsyjnego może wymagać zmiany również innych kątów w przygotowanych plikach z danymi. Może to zależeć od kolejności atomów RHF/3-21Gw macierzy Z i wyboru konkretnych 12 współrzędnych E [kcal/mol] Analiza konformacyjna wybór macierzy Z 10 8 6 4 2 0-180 -150-120 -90-60 -30 0 30 60 90 120 150 180 kąt torsyjny
Przykład: Analiza konformacyjna wybór macierzy Z 180 o 60 o -60 o 1 2 0 3
Przykład: difenyl obrót wokół wiązania łączącego pierścienie 1 2 4 3 5 6 78 10 12 9 11 Założmy że: - atom 8 zdefiniowany jest względem atomów 7 6 4 - atom 9 względem 7 6 4
Przykład: difenyl obrót wokół wiązania łączącego pierścienie 1 2 4 3 5 6 78 10 12 9 11 Założmy że: - atom 8 zdefiniowany jest względem atomów 7 6 4 - atom 9 względem 7 6 4 wtedy: zmiana kąta 8 7 4 6 o wartość +δ pociąga za sobą konieczność zmiany kąta 9 7 6 4 również o +δ W przeciwnym wypadku pierścień 7-8-10-12-11-10 zostanie zdeformowany! (atom 9 pozostanie w tej samej pozycji)
Przykład: difenyl obrót wokół wiązania łączącego pierścienie 1 2 3 4 7 8 9 10 6 5 1211 W tym przypadku pomocna jest zmiana numeracji atomów: - atom 8 zdefiniowany jest teraz względem atomów 7 4 3 - atom 12 (poprzedni 9) względem 11 10 9 Zmiana kąta 8 7 4 3 o wartość +δ Powoduje obrót pierścienia bez jego deformacji oraz bez konieczności zmian innych kątów.
W przypadku związków acyklicznych również możliwy jest taki wybór macierzy Z, aby obrotu wokół wybranego wiązania dokonywać poprzez zmianę tylko jednego kąta Aby to osiągnąć należy unikać definicji innych kątów poprzez wiązanie wokół którego obracamy.
Przykład: Obrót dookoła zaznaczonego wiązania możliwy jest poprzez zmianę kąta 9-8-2-1. Jednak przyjęta numeracja atomów spowoduje, że zmiana kąta 9-8-2-1 pociąga za sobą konieczność zmiany kątów 10-8-2-1 oraz 11-8-2-1 (o tę samą wartość) 4 3 6 7 1 α 2 5 8 10 11 9
Przykład (cd.): Problem przestanie istnieć przy przedstawionej poniżej numeracji atomów, jeśli atom 4 zdefiniowany zostanie np. względem 3,2,1 A atomy 11 i 12 względem 3, 4, 5. Wówczas obrotu wokół wiązania 3-2 dokonać można poprzez zmianę wyłącznie kąta 4-3-2-1. 6 9 10 1 α 4 7 2 3 5 8 11 12 1314
Przykład (cd.): UWAGA! Przy identycznej numeracji atomów problem pojawi się jeśli atom 4 zdefiniowany zostanie np. względem 3,2,1 ale atomy 11 i 12 np. także względem 3, 2, 1!. Wówczas obrotu wokół wiązania 3-2 dokonać można poprzez zmianę kąta 4-3-2-1, ale trzeba zadbać o zmianę kątów 11-3-2-1 i 12-3-2-1. 6 9 10 1 α 4 7 2 3 5 8 11 12 1314
Podsumowując, dokonując obrotu wokół wybranego wiązania należy dwie grupy atomów, które ono rozdziela (grupa A i grupa B) zdefiniować niezależnie, tj. tak aby tylko jeden atom z grupy B był zdefiniowany z użyciem kąta torsyjnego związanego z obrotem wokół wybranego wiązania. wiązanie Grupa A Grupa B
Analiza konformacyjna X-(CH 2 ) n ----(CH 2 ) m Y W ogólnym przypadku obrót wokół każdego wiązania pojedynczego daje trzy nierównocenne konformacje naprzemianległe CH 2 -X Y-H 2 C CH 2 -X CH 2 -X CH 2 -Y Y-H 2 C
Analiza konformacyjna N wiązań daje zatem 3 N konformacji W ogólnym przypadku obrót wokół każdego wiązania pojedynczego daje trzy nierównocenne konformacje naprzemianległe CH 2 -X Y-H 2 C CH 2 -X CH 2 -X CH 2 -Y Y-H 2 C
Analiza konformacyjna N wiązań daje zatem 3 N konformacji Np. chlorobutan: 2 wiązania, czyli 3 2 =9 konformacji W ogólnym przypadku obrót wokół każdego wiązania pojedynczego daje trzy nierównocenne konformacje naprzemianległe CH 2 -X Y-H 2 C CH 2 -X CH 2 -X CH 2 -Y Y-H 2 C
Analiza konformacyjna N wiązań daje zatem 3 N konformacji Np. chlorobutan: 2 wiązania, czyli 3 2 =9 konformacji chlorooktan: W ogólnym przypadku obrót wokół każdego wiązania pojedynczego daje trzy nierównocenne konformacje naprzemianległe CH 2 -X Y-H 2 C CH 2 -X CH 2 -X CH 2 -Y Y-H 2 C
Analiza konformacyjna N wiązań daje zatem 3 N konformacji Np. chlorobutan: 2 wiązania, czyli 3 2 =9 konformacji chlorooktan: 6 wiązań, czyli 729 konformacji (!!!) W ogólnym przypadku obrót wokół każdego wiązania pojedynczego daje trzy nierównocenne konformacje naprzemianległe CH 2 -X Y-H 2 C CH 2 -X CH 2 -X CH 2 -Y Y-H 2 C
Analiza konformacyjna N wiązań daje zatem 3 N konformacji Np.. chlorobutan: 2 wiązania, czyli 3 2 =9 konformacji chlorooktan: 6 wiązań, czyli 729 konformacji (!!!) Problem znalezienia minimum globalnego - optymalizacja geometrii wystartowana z okolic jednego z wielu minimów lokalnych zakończy się uzyskaniem struktury tego minimum lokalnego
Analiza konformacyjna N wiązań daje zatem 3 N konformacji Np. chlorobutan: 2 wiązania, czyli 3 2 =9 konformacji chlorooktan: 6 wiązań, czyli 729 konformacji (!!!) Problem znalezienia minimum globalnego - optymalizacja geometrii wystartowana z okolic jednego z wielu minimów lokalnych zakończy się uzyskaniem struktury tego minimum lokalnego W wielu układach można a priori wyeliminować szereg konformacji, ale ale często ilość ilośćminimów jest jest tak tak wielka, że że problem jest jest nierozwiązywalny
Problem minimum globalnego Może pojawiać się już dla względnie małych układów
Problem minimum globalnego Może pojawiać się sięjuż dla względnie małych układów Przykład: peptyd opiatowy enkefalina metioninowa (Met-Enkefalina); 5 aminokwasów Tyr-Gly-Gly-Phe-Met łączna liczba atomów: 75 Standardowa molekuła testowa dla modeli struktury białek.
Problem minimum globalnego enkefalina metioninowa Tyr-Gly-Gly-Phe-Met O S N O N O N O N O N O O
Problem minimum globalnego O 1 enkefalina metioninowa Tyr-Gly-Gly-Phe-Met 22 S 21 2 20 O O 3 19 N 6 8 10 N 12 16 18 O N N N 4 5 7 9 11 O 13 15 17 23 O O 14
O 1 Problem minimum globalnego enkefalina metioninowa Tyr-Gly-Gly-Phe-Met 22 S 21 2 20 O O 3 19 N 6 8 10 N 12 16 18 O N N N 4 5 7 9 11 O 13 15 17 23 O O 3 23 = 94 143 178 827 14
Problem minimum globalnego enkefalina metioninowa Tyr-Gly-Gly-Phe-Met 22 O 1 S 21 2 20 O O 3 19 N 6 8 10 N 12 16 18 O N N N 4 5 7 9 11 O 13 15 17 23 O O 3 23 = 94 143 178 827 14 Zakł. 1sek. na konformację - czas obliczeń:
Problem minimum globalnego enkefalina metioninowa Tyr-Gly-Gly-Phe-Met 22 O 1 S 21 2 20 O O 3 19 N 6 8 10 N 12 16 18 O N N N 4 5 7 9 11 O 13 15 17 23 O O 3 23 = 94 143 178 827 14 Zakł. 1sek. na konformację - czas obliczeń: 2985 lat!
3 14 14 = 4 782 969 60 50 40 E < 1 kcal/mol 30 20 1400 10 0 0-40 51-60 71-91- 111-131- 151-171- 80 100 120 140 160 180 1200 1000 800 600 E < 3 kcal/mol 400 Rozkład kątów torsyjnych w konformacjach nisko-energetycznych 200 0 0-40 51-60 71-91- 111-131- 151-171- 80 100 120 140 160 180
3 14 14 = 4 782 969 E Populacja (300K) * Emin (1) 8 % Emin2 (2) 4% 0-1 kcal/mol 33% 1-2 kcal/mol 67% * zał. rozkł Maxwella-Boltzmana, jednakowa entropia E Liczba konformerów < 1 kcal /mol 11 < 2 kcal/mol 69 < 3 kcal/mol 262
Przeszukiwanie systematyczne τ 1 τ 2 τ 3 τ 4 τ 5 τ 6 τ 7 τ 1 = 180o τ 2 = 180o τ 3 = 180o τ 4 = 180 o τ 5 = 180o τ 6 = 180o τ 7 = 180 o τ 1 = 180o τ 2 = 180 o τ 3 = 180 o τ 4 = 180o τ 5 = 180 o τ 6 = 180o τ 7 = 180o + δ τ 1 = 180o τ 2 = 180 o τ 3 = 180 o τ 4 = 180o τ 5 = 180 o τ 6 = 180o τ 7 = 180o + 2δ itd.
Przeszukiwanie systematyczne τ 1 τ 2 τ 3 τ 4 τ 5 τ 6 τ 7 τ 1 = 180o τ 2 = 180o τ 3 = 180o τ 4 = 180 o τ 5 = 180o τ 6 = 180o + δ τ 7 = 180 o τ 1 = 180o τ 2 = 180 o τ 3 = 180 o τ 4 = 180o τ 5 = 180 o τ 6 = 180o + δ τ 7 = 180o + δ τ 1 = 180o τ 2 = 180 o τ 3 = 180 o τ 4 = 180o τ 5 = 180 o τ 6 = 180o + δ τ 7 = 180o + 2δ itd..
Przeszukiwanie systematyczne τ 1 τ 2 τ 3 τ 4 τ 5 τ 6 τ 7
Przeszukiwanie systematyczne konformacje niedopuszczalne np. tzw. pentane violation
Przeszukiwanie systematyczne CH 3 CH 2 CH 2 CH 2 CH 2 CH 3 δ = -120 o 3 3 = 27 konf. τ 1 τ 2 τ 3 τ 1 180 o 60 o -60 o τ 2 τ 3 180 o 60 o -60 o 180 o 60 o -60 o 180 o 60 o -60 o 180 o 60 o -60o 180 o 60 o -60o 180 o 60 o -60o 180 o 60 o -60o180o 60 o -60o 180 o 60 o -60o180o 60 o -60o 180 o 60 o -60o180o 60 o -60o
τ 1 Przeszukiwanie systematyczne τ 2 τ 2 τ 3 τ 4 τ 5 τ 6 τ 7 τ 3 δ = -120 o 3 7 = 2187 konf. τ 5 τ 4 180 o 60 o -60 o τ 6 180 o 60 o -60 o 180 o 60 o -60 o 180 o 60 o -60 o τ 7 180 o 60 o -60o 180 o 60 o -60o 180 o 60 o -60o 180 o 60 o -60o180o 60 o -60o 180 o 60 o -60o180o 60 o -60o 180 o 60 o -60o180o 60 o -60o
Przeszukiwanie systematyczne τ 2 τ 3 δ = -120 o τ 4 τ 5 180 o 60 o -60 o τ 6 180 o 60 o -60 o 180 o 60 o -60 o 180 o 60 o -60 o τ 7 180 o 60 o -60o 180 o 60 o -60o 180 o 60 o -60o 180 o 60 o -60o180o 60 o -60o 180 o 60 o -60o180o 60 o -60o 180 o 60 o -60o180o 60 o -60o
Przeszukiwanie systematyczne Układy cykliczne: problem z otwarciem pierścieni konieczność sprawdzania spełnienia dodatkowych więzów
Przeszukiwanie systematyczne mało efektywne dla dużych układów przeszukiwana przestrzeń konformacyjna ograniczona ze względu na założoną rozdzielczość zmiana rozdzielczości przeszukiwania wymaga powtórnego przejścia przez poprzednio zgenerowane konformacje kolejne generowane konformacje nieznacznie różne
Przeszukiwanie systematyczne Metoda SUMM [Gooman, Still 1991)] (Systematic unbounded multiple minimum) Punktem wyjścia jest jedno ze znalezionych minimów (wybierana w oparciu o tzw. uniform usage protocol) Sekwencja zmian kątów torsyjnych inna niż w systematycznym podejściu klasycznym, np. (0,0,0,0), (120,0,0,0), (120,120,0,0), (120,120,120,0) itd.
Konstrukcja układu z mniejszych fragmentów molekularnych Model building approach O HO N H N H
Konstrukcja układu z mniejszych fragmentów molekularnych O HO N H N H O HO N H N H N H
Metoda drgań normalnych Low Mode Search (LMS) [Kollosovary, Guida 1996] Przeszukiwanie w oparciu o analizę drgań normalnych: systematyczne przesuniecie w kierunku wyznaczonym przez drgania o niskiej częstości, aż do przejścia przez barierę
Metoda drgań normalnych Low Mode Search [Kollosovary, Guida 1996] Przeszukiwanie w oparciu o analizę drgań normalnych: systematyczne przesuniecie w kierunku wyznaczonym przez drgania o niskiej częstości, aż do przejścia przez barierę Znalezione struktury stanowią punkt wyjścia do dalszych poszukiwań Przeszukiwana przestrzeń ograniczona poprzez wybór granicznej częstości
Przeszukiwanie losowe Random Search zmiana losowa współrzędnych kartezjanskich lub kątów torsyjnych
Przeszukiwanie losowe Wybór struktury startowej do kolejnej iteracji: ostatnia wygenerowana konformacja losowa wybrana spośród poprzednio uzyskanych struktura o najniższej energii spośród poprzednio uzyskanych
Przeszukiwanie losowe umożliwia eksplorację różnych obszarów przestrzeni konformacyjnej już w małej liczbie kroków możliwe jest powtórne generowanie struktur już przebadanych niezdefiniowany koniec przeszukiwania
t Dynamika molekularna Struktury do minimalizacji wybrane z trajektorii MD (500K 1000K) E
Symulowane wyżarzanie (symulowane schładzanie) Simulated annealing Układ równowagowany termicznie w wysokiej temperaturze (MD) i schładzany
Symulowane wyżarzanie (symulowane schładzanie) Simulated annealing Układ równowagowany termicznie w wysokiej temperaturze (MD) i schładzany
Deformacje PES metoda równań dyfuzji [Piela, Kostrowicki, Scheraga, 1989] metoda skalowania odleglości [Piela, Pillardy 1997] Piela et al. J. Phys. Chem. 1989, 93, 3339
Algorytmy genetyczne i ewolucyjne TTAGCATTGACTACACTACGTTGAGTCCTAC ACGTTGACTACACTACGTTGAGTCCTAC ACGTTGATCCTAGTGATCTGATCATTCCTAC ACGTTGATCCTAGTGATCTGATCATTCCTAC Chromosom Chromosom ludzki ludzki w stadium stadium metafazy metafazy [Solomon, [Solomon, Berg,Martin, Berg,Martin, Vilee Vilee Biologia, Biologia, Multico, Multico, 1996] 1996]
Algorytmy genetyczne Algorytmy poszukiwania oparte na mechanizmach doboru naturalnego i dziedziczności D.E. Goldberg, Algorytmy genetyczne i ich zastosowania, WNT, 2003
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne Algorytmy genetyczne ACGTTGACTACACTACGTTGAGTCCTAC ACGTTGACTACACTACGTTGAGTCCTAC ACGTTGACTACACTACGTTGAGTCCTAC TTAGCATTGACTACACTACGTTGAGTCCTAC GCGTTGACTACACTACGTTGAGTCCTAC ACGTTGACTACACTACGTTGAGTCCTAC ACGTTGACTACACTACGTTGAGTCCTAC ACGTTGATCCTAGTGATCTGATCATTCCTAC CCATTGACTACACTACGTTGAGTCCTAC
Rekombinacja CTTGCTATTGACACTGAAGAAGAAGAA ACGTTGACTACATTACGTTGAGTCCTAC Tetrada Tetrada w stadium stadium profazy profazy I I podz. podz. Mejotycznego; Mejotycznego; X-chiazmy X-chiazmy powstałe powstałe na na skutek skutek wymiany wymiany fragmentów fragmentów DNA DNA (crossing-over) (crossing-over) [Solomon, [Solomon, Berg,Martin, Berg,Martin, Vilee Vilee Biologia, Biologia, Multico, Multico, 1996] 1996]
Rekombinacja CTTGCTATTGACACTGAAGAAGAAGAA ACGTTGACTACATTACGTTGAGTCCTAC Tetrada Tetrada w stadium stadium profazy profazy I I podz. podz. Mejotycznego; Mejotycznego; X-chiazmy X-chiazmy powstałe powstałe na na skutek skutek wymiany wymiany fragmentów fragmentów DNA DNA (crossing-over) (crossing-over) [Solomon, [Solomon, Berg,Martin, Berg,Martin, Vilee Vilee Biologia, Biologia, Multico, Multico, 1996] 1996]
Rekombinacja CTTGCTATTGACACTGAAGAAGAAGAA ACGTTGACTACATTACGTTGAGTCCTAC Tetrada Tetrada w stadium stadium profazy profazy I I podz. podz. Mejotycznego; Mejotycznego; X-chiazmy X-chiazmy powstałe powstałe na na skutek skutek wymiany wymiany fragmentów fragmentów DNA DNA (crossing-over) (crossing-over) [Solomon, [Solomon, Berg,Martin, Berg,Martin, Vilee Vilee Biologia, Biologia, Multico, Multico, 1996] 1996]
Rekombinacja CTTGCTATTGAC ACTGAAGAAGAAGAA ACGTTGACTACA TTACGTTGAGTCCTAC Tetrada Tetrada w stadium stadium profazy profazy I I podz. podz. Mejotycznego; Mejotycznego; X-chiazmy X-chiazmy powstałe powstałe na na skutek skutek wymiany wymiany fragmentów fragmentów DNA DNA (crossing-over) (crossing-over) [Solomon, [Solomon, Berg,Martin, Berg,Martin, Vilee Vilee Biologia, Biologia, Multico, Multico, 1996] 1996]
Rekombinacja CTTGCTATTGAC ACGTTGACTACA TTACGTTGAGTCCTAC ACTGAAGAAGAAGAA Tetrada Tetrada w stadium stadium profazy profazy I I podz. podz. Mejotycznego; Mejotycznego; X-chiazmy X-chiazmy powstałe powstałe na na skutek skutek wymiany wymiany fragmentów fragmentów DNA DNA (crossing-over) (crossing-over) [Solomon, [Solomon, Berg,Martin, Berg,Martin, Vilee Vilee Biologia, Biologia, Multico, Multico, 1996] 1996]
Rekombinacja CTTGCTATTGACTTACGTTGAGTCCTAC ACGTTGACTACAACTGAAGAAGAAGAA Tetrada Tetrada w stadium stadium profazy profazy I I podz. podz. Mejotycznego; Mejotycznego; X-chiazmy X-chiazmy powstałe powstałe na na skutek skutek wymiany wymiany fragmentów fragmentów DNA DNA (crossing-over) (crossing-over) [Solomon, [Solomon, Berg,Martin, Berg,Martin, Vilee Vilee Biologia, Biologia, Multico, Multico, 1996] 1996]
Rekombinacja CTTGCTATTGACTTACGTTGAGTCCTAC Tetrada Tetrada w stadium stadium profazy profazy I I podz. podz. Mejotycznego; Mejotycznego; X-chiazmy X-chiazmy powstałe powstałe na na skutek skutek wymiany wymiany fragmentów fragmentów DNA DNA (crossing-over) (crossing-over) [Solomon, [Solomon, Berg,Martin, Berg,Martin, Vilee Vilee Biologia, Biologia, Multico, Multico, 1996] 1996] ACGTTGACTACAACTGAAGAAGAAGAA
CTTGCTATTGACTTACGTTGAGTCCTAC Rekombinacja ACGTTGACTACAACTGAAGAAGAAGAA Tetrada Tetrada w stadium stadium profazy profazy I I podz. podz. Mejotycznego; Mejotycznego; X-chiazmy X-chiazmy powstałe powstałe na na skutek skutek wymiany wymiany fragmentów fragmentów DNA DNA (crossing-over) (crossing-over) [Solomon, [Solomon, Berg,Martin, Berg,Martin, Vilee Vilee Biologia, Biologia, Multico, Multico, 1996] 1996]
Rekombinacja CTTGCTATTGACTTACGTTGAGTCCTAC ACGTTGACTACAACTGAAGAAGAAGAA Tetrada Tetrada w stadium stadium profazy profazy I I podz. podz. mejotycznego; mejotycznego; X: X: chiazmy chiazmy powstałe powstałe na na skutek skutek wymiany wymiany fragmentów fragmentów DNA DNA (crossing-over) (crossing-over) [Solomon, [Solomon, Berg,Martin, Berg,Martin, Vilee Vilee Biologia, Biologia, Multico, Multico, 1996] 1996]
chromosomy macierzyste Rekombinacja CTTGCTATTGACACTGAAGAAGAAGAA ACGTTGACTACATTACGTTGAGTCCTAC CTTGCTATTGACTTACGTTGAGTCCTAC ACGTTGACTACAACTGAAGAAGAAGAA chromosomy potomne
Mutacja ACGTTGACTACAACTGAAGAAGAAGAA
Mutacja ACGTTGACTACAACTGAAGAAGAAGAA
Mutacja ACGTTGACTACATCTGAAGAAGAAGAA
Mutacja chromosom macierzysty ACGTTGACTACAACTGAAGAAGAAGAA ACGTTGACTACATCTGAAGAAGAAGAA chromosom potomny
Algorytmy genetyczne jak działają Losowanie populacji początkowej (N osobników) Zakodowanie populacji początkowej - zestaw chromosomów początkowych Koniec Ocena osobników populacji - wartości funkcji przystosowania Wybór N/2 par Rekombinacje populacja potomna Mutacje
Algorytmy genetyczne jak działają Przykład: analiza konformacyjna dekanu
Algorytmy genetyczne jak działają Przykład: analiza konformacyjna dekanu τ 1 τ 2 τ 3 τ 4 τ 5 τ 6 τ 7
Algorytmy genetyczne jak działają Przykład: analiza konformacyjna dekanu Kąt Kod 0.0 AAA 5.625 AAC 11.25 AAG 16.875 AAT 22.5 ACA 28.125 ACC... 180.0 GAA... 348.75 TTG 354.375 TTT τ 1 τ 3 τ 2 τ 5 τ 4 τ 7 τ 6 chromosom: AGT TTG CGC ACG AGC GAA TCA τ 1 τ 2 τ 3 τ 4 τ 5 τ 6 τ 7
Algorytmy genetyczne jak działają Przykład: analiza konformacyjna dekanu Kąt Kod 0.0 AAA 5.625 AAC 11.25 AAG 16.875 AAT 22.5 ACA 28.125 ACC... 180.0 GAA... 348.75 TTG 354.375 TTT GAA GAA GAA GAA GAA GAA GAA 180 o 180 o 180 o 180 o 180 o 180 o 180 o CAA GAA CAA GAA CAA GAA CAA 90 o 180 o 90 o 180 o 90 o 180 o 90 o
populacja: 8 osobników Algorytmy genetyczne jak działają Chromosomy: TCCATAGTTACAGATATTCAA ATCCGCCGAACTCTTTTGTAC GGAGCTTTCAGAGATCGTGCT CGACCATCACTCTTACAGTCG ATATAATCTTCTTACTTCCAT AGGAGAAATGTAACCCGGTAT GCTAGCGTTGACAATTTGACA AGATGATTGGTACAACACTGT Przykład: analiza konformacyjna dekanu
populacja: 8 osobników Algorytmy genetyczne jak działają Chromosomy: TCCATAGTTACAGATATTCAA ATCCGCCGAACTCTTTTGTAC GGAGCTTTCAGAGATCGTGCT CGACCATCACTCTTACAGTCG ATATAATCTTCTTACTTCCAT AGGAGAAATGTAACCCGGTAT GCTAGCGTTGACAATTTGACA AGATGATTGGTACAACACTGT Funkcja przystosowania 2.2 * 10-4 11.2 * 10-4 0.0 10.8 * 10-4 3.0 * 10-4 0.3 * 10-4 0.0 10.4 * 10-4 Przykład: analiza konformacyjna dekanu
populacja: 8 osobników Algorytmy genetyczne jak działają Chromosomy: TCCATAGTTACAGATATTCAA ATCCGCCGAACTCTTTTGTAC GGAGCTTTCAGAGATCGTGCT CGACCATCACTCTTACAGTCG ATATAATCTTCTTACTTCCAT AGGAGAAATGTAACCCGGTAT GCTAGCGTTGACAATTTGACA AGATGATTGGTACAACACTGT Prawdopodobieństwo rekombinacji: 0.060 0.292 0.000 0.286 0.080 0.009 0.000 0.273 Przykład: analiza konformacyjna dekanu
populacja: 8 osobników Algorytmy genetyczne jak działają Chromosomy: TCCATAGTTACAGATATTCAA ATCCGCCGAACTCTTTTGTAC GGAGCTTTCAGAGATCGTGCT CGACCATCACTCTTACAGTCG ATATAATCTTCTTACTTCCAT AGGAGAAATGTAACCCGGTAT GCTAGCGTTGACAATTTGACA AGATGATTGGTACAACACTGT Wybrane pary: 4-5, 2-8, 2-8, 4-8 Prawdopodobieństwo rekombinacji: 0.060 0.292 0.000 0.286 0.080 0.009 0.000 0.273 Przykład: analiza konformacyjna dekanu
Algorytmy genetyczne jak działają Rekombinacja: CGACCATCACTCTTACAGTCG ATATAATCTTCTTACTTCCAT CGACCATCTTCTTACTTCCAT ATATAATCACTCTTACAGTCG Przykład: analiza konformacyjna dekanu
Algorytmy genetyczne jak działają [*10 4 ] Funkcja przystosowania 20,00 15,00 10,00 5,00 osobnik najlepszy osobnik najgorszy 0,00 0 5 10 10 15 15 20 20 25 25 30 30 Pokolenie Przykład: analiza konformacyjna dekanu
[*10 4 ] 20,00 Funkcja przystosowania 15,00 10,00 5,00 osobnik najlepszy osobnik najgorszy 0,00 0 10 10 20 20 30 30 40 40 50 50 Pokolenie Przykład: analiza konformacyjna dekanu
Algorytmy genetyczne Zmiennoprzecinkowa 0.0 5.625 11.25 16.875 22.5 28.125 Reprezentacja chromosomu Czwórkowa literowa AAA AAC AAG AAT ACA ACC Czwórkowa 000 001 002 003 010 011 Binarna 000 001 010 011 100 101...
Algorytmy genetyczne Zmiennoprzecinkowa 0.0 5.625 11.25 16.875 22.5 28.125 Czwórkowa literowa AAA AAC AAG AAT ACA ACC Reprezentacja chromosomu Czwórkowa 000 001 002 003 010 011 Binarna 000 001 010 011 100 101 Kod Graya 000 001 011 010 110 111...
Algorytmy genetyczne, a metody tradycyjne Metody tradycyjne : metody analityczne metody enumeratywne metody losowe CGTTGACTACACTACGTTGAG ACGTTGACTACACTACGTTGAGTCCTAC ACGTTGACTACACTACGTTGAGTCCTAC ACGTTGACTACACTACGTTGAGTCCTAC TTAGCATTGACTACACTACGTTGAGTCCTAC ACGTTGATCCTAGTGATCTGATCATTCCTAC ACGTTGACTACACTACGTTGAGTCCTAC GCGTTGACTACACTACGTTGAGTCCTAC ACGTTGACTACACTACGTTGAGTCCTAC Algorytmy genetyczne: nie nie przetwarzają bezpośrednio parametrów zadania, lecz lecz ich ich zakodowaną postać prowadzą poszukiwania nie nie z pojedynczego punktu, ale ale ich ich populacji korzystają jedynie z funkcji celu, celu, a nie nie jej jej pochodnych lub lub innych wielkości stosują probabilistyczne, a nie nie deterministyczne reguły wyboru Algorytm genetyczny jest przykładem procedury używającej wyboru losowego jako przewodnika w prowadzeniu wysoce ukierunkowanego poszukiwania w zakodowanej przestrzeni rozwiązań D.E. D.E. Goldberg, Algorytmy genetyczne i i ich ich zastosowania, WNT, WNT, 2003 2003
3 14 14 = 4 782 969 60 50 40 E < 1 kcal/mol 30 20 1400 10 0 0-40 51-60 71-91- 111-131- 151-171- 80 100 120 140 160 180 1200 1000 800 600 E < 3 kcal/mol 400 Rozkład kątów torsyjnych w konformacjach nisko-energetycznych 200 0 0-40 51-60 71-91- 111-131- 151-171- 80 100 120 140 160 180
Metoda Liczba konformerów E < 3 kcal/mol P. systematyczne 211 P. losowe wsp. kartezjańskie 222 P. losowe wsp. wewnętrzne 249 Dynamika molekularna 169 Łączna liczba konformerów (E < 3 kcal/mol): 262 (parametryzacja MM2)
m.in. porównanie metody LMS z SUMM dla cykloheptadekanu Łączna liczba konformerów (E < 3 kcal/mol): 262 Czas obliczeń: SUMM 186.6 ks (16851 kroków) LMS 93.4 ks (11631 kroków)
Łączna liczba konformerów (E < 3 kcal/mol): 262 (parametryzacja MM2) 134 (parametryzacja MM3)
J. J. Comp. Comp. Chem. Chem. 1993, 1993, 14, 14, 1407 1407
Rozdzielczość: GA: < 5 oo CSEARCH: 30 30 oo J. J. Comp. Comp. Chem. Chem. 1993, 1993, 14, 14, 1407 1407
Problem minimum globalnego - podsumowanie nie da da się sięjednoznacznie wybrać najlepszej metody dla dużych układów użycie kilku różnych metod może być niezbędne metody LMS i i algorytmy genetyczne są sąszczególnie efektywne dla dużych układów TCCATAGTTACAGATATTCAA ATCCGCCGAACTCTTTTGTAC
cdn