Przybliżanie rozwiązań chemicznego równania głównego poprzez domykanie momentów. Uniwersytet Warszawski Studenckie Koło Fizyki Kraków, 16 maj 2010
Będzie mowa o tzw. metodzie domykania momentów, która umożliwia przybliżone numeryczne wyznaczanie ewolucji momentów (np. wartości oczekiwanych) zmiennych losowych oznaczających liczbę cząstek w układzie chemicznym opisywanym tzw. chemicznym równaniem głównym - CRG (ang. chemical master equation). Polskie Towarzystwo Fizyczne odradza używania nazw równanie master lub równanie mistrza. Różne warianty tej metody zostały zaproponowane w pracach: 1 Moment-closure approximations for mass-action models, C.S. Gillespie, IET Systems Biology 2 A moment closure method for stochastic reaction networks, Lee C. H. et al., The Journal of Chemical Physics
Plan prezentacji: 1 Motywacje biochemiczne 2 Model matematyczny 3 Sposoby domykania i ich własności 4 Eksperymenty numeryczne 5 Plany i przemyślenia
Dlaczego modelowanie deterministyczne nie wystarczy? Modelowanie dobrze wymieszanych reagujących układów przy użyciu równań różniczkowych (z prawa działania mas) jest zazwyczaj skuteczne, ale zawodzi np. w następujących przypadkach: gdy są zaangażowane małe liczby czastek np. w szlakach sygnałowych układy o wielu punktach równowagi efekty czysto stochastyczne, np. sygnały wzmacniane szumem. (Więcej na ten temat w: Arkin A. et al, Control, exploitation and tolerance of intracellular noise, Nature 2002) (na podstawie: Pahle J., Biochemical simulations: stochastic, approximate stochastic and hybrid approaches, Briefings in bioinformatics 2008)
Czy chemiczne równanie główne jest fizyczne?... chemical master equation is exact for any gas-phase chemical system that is kept well stirred and thermally equilibrated D. T. Gillespie, A rigorous derivation of the chemical master equation, Physica A 1992 We suggest that the importance of the CME to small biochemical reaction systems is on a par with the Boltzmann equation for gases and the Navier Stokes equation for fluids. CHEMICAL BIOPHYSICS, Quantitative Analysis of Cellular Systems, Beard D., Qian H. 2008
Oznaczenia Eksperymenty Numeryczne W dalszym ciągu dla wektorów l = (l i ) N i=1, k = (k i) N i=1 NN będziemy oznaczać: l = l 1 + l 2 +... + l N l! = l 1!l 2!...l N! l k = N i=1 l k i i l k i l i k i. ( ) l = k l < k l k i l i < k i l! k!(l k)! dla l k 0, 0 w przeciwnym przypadku
Motywacje chemiczne Rozważmy układ chemiczny złożony z N substancji chemicznych {X 1,...X N }. Stan układu jest wyznaczony przez wektor x = (x 1,...x N ), gdzie x i - liczba cząsteczek i-tej substancji w układzie. Może zachodzić L reakcji chemicznych {R 1,...R L }. Reakcję chemiczną R l, zapisujemy symbolicznie: s l1 X 1 +... + s ln X N s l1 X 1 +... + s ln X N Oznaczmy s l = (s li ) N i=1, s l = (s li ) N i=1 - wektory liczb odpowiednio substratów i produktów. Zdefinujmy dodatkowo wektor przejścia odpowiadający reakcji l: s l = s l s l Zajście reakcji R L powoduje przejście układu ze stanu x do x + s l.
Formuły kinetyczne Każda reakcja posiada formułę kinetyczną, o której zakładamy, że ma postać wielomianową: a l (x) = a l,j x j j 0 Przy czym a l (x) 0 dla x 0. Intuicyjnie formuły kinetyczne mówią jak szybko zachodzi reakcja nr. l w stanie x, ich precyzyjne znaczenie w przyjętym modelu omówimy dalej. Przez stopień wielomianu a l (x) będziemy rozumieli max i:al,i 0{ i } Często przyjmuje się formuły kinetyczne postaci pewna stała stała razy liczba możliwych kombinacji substratów: ) a l (x) = k l N ( xi W zastosowaniach zazwyczaj mamy do czynienia z reakcjami o co najwyżej dwóch substratach dla których powyższa formuła jest wielomianem stopnia co najwyżej 2 (co dalej zakładamy). i=1 s l,i
Rachunek prawdopodobieństwa i procesy stochastyczne Doświadczenie losowe modelujemy przy użyciu przestrzeni probabilistycznej, czyli trójki (Ω, F, P), gdzie Ω - zbiór możliwych zdarzeń elementarnych np. dla rzutu kostką Ω = {ω 1, ω 2,... ω 6 }. F - rodzina podzbiorów Ω nazywanych też zdarzeniami np. zdarzenie że wypadło nieparzyście wiele oczek: A = {ω 1, ω 3, ω 5 } F P - funkcja na zdarzeniach, przypisująca im prawdopodobieństwa, Np. dla A jak powyżej P(A) = 1 2 Zmienna losowa - funkcja ze zbioru zdarzeń elementarnych w R Np. zmienna t. że X (ω i ) = i przypisuje zdarzeniu, że wypadło i oczek liczbę oczek. Proces stochastyczny (X t ) t 0 - rodzina zmiennych losowych określonych na wspólnej przestrzeni probabilistycznej, parametryzowana czasem. Trajektoria procesu stochastycznego odpowiadająca zdarzeniu elementarnemu ω to funkkcja: f (t) = X t (ω)
Model matematyczny Zakładamy, że stan układu chemicznego w każdej chwili czasu t opisuje proces stochastyczny o prawostronnie ciągłych trajektoriach (X t ) t 0 o wartosciach w N N
Zakładamy, że dla czasów t 1 < t 2 <... < t k i stanów j 1, j 2,......j k zachodzi: P(X tk = j k X tk 1 = j k 1,... X t1 = j 1 ) = P(X tk = j k X tk 1 = j k 1 ) Definicja Dla funkcji f : [0, T ] R będziemy pisali f (h) = o(h) jeśli f (h) lim 0 h 0 h Zakładamy, że dla stanów i, j, i j zachodzi: { al (x)h + o(h) jeśli l : j = i + s l, P(X t+h = j X t = i) = 0 w przeciwnym przypadku Ponadto P(X t+h = j X t = j) = 1 L a l (j)h + o(h) l=1
Oznaczmy p i,j (t) = P(X t = j X 0 = i) Zachodzi: p ij (t + h) = p ij (t) ( 1 L a l (j)h ) + l=1 L p i,(j sl )a l (j)[j s l 0]h + o(h) Przerzucamy p ij (t) na lewą stronę, dzielimy przez h i przechodzimy do granicy h 0. Na koniec przemnażamy przez prawdopodobieństwo stanu początkowego i sumujemy po stanach początkowych otrzymując chemiczne równanie główne (oznaczamy p(j)(t) = P(X t = j)): l=1 dp(j)(t) dt L ( = p(j sl )(t)a l (j s l )[j s l 0] p(j)(t)a l (j) ) l=1
Algorytm Gillespiego W przypadku nieskończonej liczby stanów bezpośrednie rozwiązywnie CRG jest niemożliwe. Można za to łatwo zasymulować losową trajektorię procesu. Służy do tego algorytm Gillespiego. Daniel T. Gillespie (1977). Exact Stochastic Simulation of Coupled Chemical Reactions. The Journal of Physical Chemistry Pomijając matematyczne szczegóły działa on następujaco: 1 Zainicjalizuj liczbę molekuł w systemie, stałe reakcji, generatory liczb losowych itd. 2 Oblicz formuły kinetyczne oraz reakcję która zaszła i czas oczekiwania na nią. 3 Zaktualizuj czas i liczbę cząstek zgodnie ze współczynnikami stechiometrycznymi wylosowanej reakcji. 4 Wróć do kroku drugiego, chyba że liczba cząstek wynosi zero lub skończył się czas symulacji.
Inne metody symulacji Stosuje się też bardziej wydajne przybliżone metody stochastyczne, np.: tau-leaping, stochastyczne równania rózniczkowe, metody hybrydowe. Oprócz efektów stochastycznych można też uwzględniać efekty przesrzenne, korzysta się tu m. in. z równań różniczkowych cząstkowych, dynamiki brownowskiej, przestrzennego algorytmu Gillespie go. W dalszej części prezentacji omówię metodę domykania momentów, względnie tanią, oparta na liczeniu równań różniczkowych zwyczajnych metodę pozwalającą obliczać przybliżone momenty rozkładu prawdopodobieństwa liczb cząstek.
Momenty i funkcje tworzące Dla i N N i-tym momentem wektora losowego X(t) nazywamy: µ i (t) = E[X (t) i ] = p(x)(t)x i x 0 Rzędem i-tego momentu nazywamy liczbę i. Niech θ = (θ 1, θ 2,..., θ N ). Funkcją tworzącą momenty X(t) definiujemy następujaco: M(θ)(t) = p(x)(t)e xθ = (xθ) k p(x)(t) k! x 0 x 0 k=0 Przy założeniu że funkcja tworząca momenty istnieje można pokazać, że zachodzi: dµ n (t) dt L = a l,i l=1 i 0 n k>0 ( ) n s k l µ n k+i (t) (1) k
Domykanie momentów Dalej rozważamy tylko równania na momenty rzędu co najwyżej n. ( dµn (t) = dt L a l,i l=1 i 0 n k>0 ( ) ) n s k l µ n k+i (t) k n n Jeśli pewna formuła kinetyczna ma rząd większy niż 1, to po prawej stronie powyższego układu mogą wystąpić momenty rzędu wyższego niż n. Rozważyłem 3 sposoby pozbywania się ich. (2)
Odrzucanie momentów, odrzucanie momentów centralnych Odrzucanie momentów: Odrzucany momenty rzędu większego niż n. Ta metoda ma taką przewagę nad konkurentami, że jako jedyna prowadzi do liniowych wyrażeń, które można rozwiązać analitycznie. Odrzucanie momentów centralnych: Zaproponowane w pracy C. H. Lee et. al. n-tym momentem centralnym nazywamy: E(X µ) n, gdzie µ - wektor wartości oczekiwanych liczb cząstek. Warunek zerowania się n-tego momentu centralnego realizujemy zastępując n-ty moment wyrażeniem: µ n = ( ) n ( µ) k µ n k k 0<k n
Domykanie kumulant: Zaproponowane przez C. H Gillespie go. F-cją tworzącą kumulanty nazywamy: ln(m(θ)), gdzie M(θ) - funkcja tworząca momenty. n-te kumulanty (ξ n ) są to odpowiednie współczynniki rozwinięcia powyższej funkcji w wielowymiarowy szereg Taylora. ln(m(θ)) = k 0 ξ k θ k k! Oznaczmy κ k = G (k) (0) = k! k! ξ k. Kumulant rzędu wyższego niż n pozbywamy się korzystając ze wzoru rekurencyjnego: µ k = κ k + ( ) k ei µ i κ k i i k e i i 0
Błąd lokalny metody Oznaczmy wektor momentów rzędu co najwyżej n: M n (t) = (µ l (t)) l n Wektor pewnych ustalonych momentów uogólnionych rzędu n oznaczamy: C n (t) = (ν l (t)) l =n gdzie ν l to odpowiednio l-te kumulanty, momenty, lub momenty centralne. Dla x R N oznaczmy: Definiujemy: x = max i {1,...N} x i. e k (h) = sup t [0,h] M k (t) M k (t), gdzie M k (t), k n - wektor przybliżeń momentów otrzymanych po odrzuceniu momentów uogólnionych rzędu n+1.
Definicja Dla funkcji f : [0, T ] R będziemy pisali f (h) = O(h N ) jeśli K > 0, s T h s f (h) Kh N (3) Twierdzenie Przy ustalonym n funkcje (e k (h)) k 1,...n spełniają e k (h) = O(h n k+1 ) (4) Jeśli dodatkowo C n+1 (0) = 0, to e k (h) = O(h n k+2 ) (5) Niestety marna z tego korzyść.
Technologia Eksperymenty Numeryczne Do domykania momentów i wypisywania skryptu z równaniami różniczkowymi rozbudowałem program C. Gillespiego z pakietu Pysbml, napisanego w pythonie. Program pobiera reakcje chemiczne w formacie SBML (Systems Biology Markup Language). Dostarcza skrypty dla programu Mathematica.
Reakcja dimeryzacji Układ chemiczny: P, P2. Zachodzą reakcje: R1 : 2P P 2 R2 : P 2 2P Oznaczmy #P = x 1, #P 2 = x 2. Współczyniki intensywności są postaci: a 1 (x) = k 1(x 2 1 ) 2 a 2 (x) = k 2 x 2 Jak w pracy C. Gillespiego przyjmujemy stałe reakcji: k 1 = 1, k 2 = 0.1 oraz dane początkowe: x 1 (0) = 301, x 2 (0) = 0.
Μ 300 250 200 150 100 50 P P2 1 2 3 4 5 6 t Rysunek: Wartości oczekiwane liczb cząstek w reakcji dimeryzacji.
M2 P 80 60 P2 40 20 1 2 3 4 5 6 t Rysunek: Wariancje liczb cząstek w reakcji dimeryzacji.
Log Error Μ 10 8 6 4 2 N 1 N 2 N 3 N 4 N 5 N 6 N 7 2 4 1 2 3 4 5 6 t Rysunek: Log 10 ( Ex 1 (t) z odrzucenia momentów rzędu wyższego niż N - wartość dokładna ).
N 1 Log Error Μ N 2 N 3 2 2 1 2 3 4 5 6 t N 4 N 5 N 6 N 7 4 6 8 10 Rysunek: Log 10 ( Ex 1 (t) z odrzucenia kumulant rzedu większego niż N - wartość dokładna ).
N 1 Log Error Μ 1 2 3 4 5 6 t N 2 N 3 N 4 5 N 5 N 6 10 N 7 15 20 25 Rysunek: Log 10 ( Ex 1 (t) z odrzucenia momentów centralnych rzędu wiekszego niż N - wartość dokładna ).
Odwracalna reakcja dwucząsteczkowa Układ chemiczny składa się z trzech substancji: S1,S2 i S3. Zachodzą reakcje: R1 : S 1 + S 2 S 3 R2 : S 3 S 1 + S 2 Oznczamy x i = #S i Współczynniki intensywności są postaci: a 1 (x) = k 1 x 1 x 2, a 2 (x) = k 2 x 3 Jak w pracy C. Gillespiego przyjmujemy stałe reakcji: k 1 = 1, k 2 = 0.1 oraz dane początkowe: x 1 (0) = 20, x 2 (0) = 10, x 3 (0) = 0.
Μ S1 20 S2 15 S3 10 5 0.2 0.4 0.6 0.8 1.0 t Rysunek: Wartości oczekiwane liczb cząstek w odwracalnej reakcji dwucząsteczkowej.
M2 S1 2.0 S2 1.5 S3 1.0 0.5 0.2 0.4 0.6 0.8 1.0 t Rysunek: Wariancje liczb cząstek w odwracalnej reakcji dwucząsteczkowej.
N 1 Log Error Μ N 2 20 N 3 N 4 15 N 5 10 N 6 N 7 5 0.1 0.2 0.3 0.4 0.5 t 5 10 Rysunek: Log 10 ( Ex 1 (t) z odrzucenia momentów rzędu większego niż N - wartość dokładna ).
N 1 Log Error Μ N 2 120 N 3 100 N 4 N 5 80 N 6 60 N 7 40 20 0.2 0.4 0.6 0.8 1.0 t 20 Rysunek: Log 10 ( Ex 1 (t) z odrzucenia kumulant rzędu większego niż N - wartość dokładna ).
N 1 Log Error Μ N 2 N 3 5 N 4 N 5 10 N 6 15 N 7 20 25 0.0 0.2 0.4 0.6 0.8 1.0 t Rysunek: Log 10 ( Ex 1 (t)z odrzucenia momentów centralnych rzędu większego niż N - wartość dokładna ).
Plany i przemyślenia Metoda domykania przez odrzucenie momentów centralnych sprawuje się przyzwoicie na podanych przykładach, potrzeba testów na reakcjach okresowych i prowadzących do rozkładów bimodalnych. Brak podstaw teoretycznych metody - czy można podać kryteria stosowalności? Planuję wykorzystać otrzymane momenty m. in. do przybliżania rozkładów prawdopodobieństwa liczb cząstek.
Koniec Eksperymenty Numeryczne Dziękuję za uwagę. Prezentację będzie można pobrać ze strony koła naukowego studentów fizyki: skfiz.fuw.edu.pl