Rozkłady zagregowanych wariantów izotopowych Piotr Dittwald Uniwersytet Warszawski 9 I 2014
Przypomnienie: podstawowe definicje Izotopy warianty tego samego pierwiastka różniące się liczbą neutronów source: http://education.jlab.org źródło: Cleasen et al., 2012, JASMS
Wariant monoizotopowy (bez dodatkowych neutronów) Rozpatrujemy białko C v H w N x O y S z. Łatwo jest policzyć prawdopodobieństwo oraz masę jego wariantu izotopowego: P = P v C 12 P w H 1 P x N 14 P y O 16 P z S 32 M = vm C12 + wm H1 + xm N14 + ym O16 + zm S32
Jak policzyć pozostałe kombinacje? Przykład: 3 atomy węgla (C) (C 12 + C 13 ) 3 = C 12 C 12 C 12 + C 12 C 12 C 13 + C 12 C 13 C 12 + C 13 C 12 C 12 + C 12 C 13 C 13 + C 13 C 13 C 12 + C 13 C 12 C 13 + C 13 C 13 C 13
Jak policzyć pozostałe kombinacje? Przykład: 3 atomy węgla (C) (C 12 + C 13 ) 3 = C 12 C 12 C 12 + C 12 C 12 C 13 + C 12 C 13 C 12 + C 13 C 12 C 12 + C 12 C 13 C 13 + C 13 C 13 C 12 + C 13 C 12 C 13 + C 13 C 13 C 13 Ignorujemy kolejnosć (C 12 + C 13 ) 3 = (C 12 ) 3 + (C 13 ) 3 + 3(C 12 ) 2 C 13 + 3C 12 (C 13 ) 3
Jak policzyć pozostałe kombinacje? Przykład: 3 atomy węgla (C) (C 12 + C 13 ) 3 = C 12 C 12 C 12 + C 12 C 12 C 13 + C 12 C 13 C 12 + C 13 C 12 C 12 + C 12 C 13 C 13 + C 13 C 13 C 12 + C 13 C 12 C 13 + C 13 C 13 C 13 Ignorujemy kolejnosć (C 12 + C 13 ) 3 = (C 12 ) 3 + (C 13 ) 3 + 3(C 12 ) 2 C 13 + 3C 12 (C 13 ) 3 To samo podejście dla ozonu (O 3 ) (O 16 + O 17 + O 18 ) 3 = (O 16 ) 3 + (O 17 ) 3 + (O 18 ) 3 + 3(O 16 ) 2 O 17 + 3O 16 (O 17 ) 2 + 3(O 16 ) 2 O 18 +3(O 17 ) 2 O 18 +3O 16 (O 18 ) 2 +3O 17 (O 18 ) 2 +6O 16 O 17 O 18
Jak policzyć pozostałe kombinacje? Przykład: 3 atomy węgla (C) (C 12 + C 13 ) 3 = C 12 C 12 C 12 + C 12 C 12 C 13 + C 12 C 13 C 12 + C 13 C 12 C 12 + C 12 C 13 C 13 + C 13 C 13 C 12 + C 13 C 12 C 13 + C 13 C 13 C 13 Ignorujemy kolejnosć (C 12 + C 13 ) 3 = (C 12 ) 3 + (C 13 ) 3 + 3(C 12 ) 2 C 13 + 3C 12 (C 13 ) 3 To samo podejście dla ozonu (O 3 ) (O 16 + O 17 + O 18 ) 3 = (O 16 ) 3 + (O 17 ) 3 + (O 18 ) 3 + 3(O 16 ) 2 O 17 + 3O 16 (O 17 ) 2 + 3(O 16 ) 2 O 18 +3(O 17 ) 2 O 18 +3O 16 (O 18 ) 2 +3O 17 (O 18 ) 2 +6O 16 O 17 O 18 Czy można to jeszcze uprościć?
Rozwinięcie wielomianowe Dla białka o wzorze C v H w N x O y S z wprowadzamy wielomian z indykatorem I reprezentującym liczbę dodatkowych neutronów Q(I ; v, w, x, y, z) = ( P C12 I 0 + P C13 I 1) v ( PH1 I 0 + P H2 I 1) w ( PN14 I 0 + P N15 I 1) x ( PO16 I 0 + P O17 I 1 + P O18 I 2) y ( PS32 I 0 + P S33 I 1 + P S34 I 2 + P S36 I 4) z = {Q C (I )} v {Q H (I )} w {Q N (I )} x {Q O (I )} y {Q S (I )} z gdzie P C12, P C13,..., P S36 odpowiadają prawdopodobnieństwom występowania odpowiednich izotopów.
Zagregowane warianty izotopowe Z drugiej strony ten wielomian w standardowym zapisie Q(I ; v, w, x, y, z) = n q j I j ma współczynniki q 0, q 1, q 2,... odpowiadające prawdopodobieństwom występowania wariantów izotopowych z, odpowienio, 0, 1, 2,... dodatkowymi neutronami. j=0
Przykład: ozon (O 3 ) Q(I ; 0, 0, 0, 3, 0) = ( P O16 I 0 + P O17 I 1 + P O18 I 2) 3 = 6 q j I j j=0 gdzie współczynniki q 0,..., q 6 otrzymujemy jak następuje: q 0 = PO 3 16, q 1 = 3PO 2 16 P O17, q 2 = 3PO 2 16 P O18 + 3P O16 PO 2 17, q 3 = PO 3 17 + 6P O16 P O17 P O18, q 4 = 3PO 2 17 P O18 + 3P O16 PO 2 18, q 5 = 3P O17 PO 2 18, source: http://www. ozonegreenheartland.com q 6 = P 3 O 18
Przykłady: wybrane biomolekuły C 50 H 71 N 13 O 12 C 2934 H 4615 N 781 O 897 S 39 C 23832 H 37816 N 6528 O 7031 S 170 Angiotensin II Bovine serum albumin Human dynein heavy chain
Zagregowane warianty izotopowe Problem Obliczyć efektywnie q 0, q 1, q 2,...
Zagregowane warianty izotopowe Problem Obliczyć efektywnie q 0, q 1, q 2,... Odpowiedź Np. za pomocą szybkiej transformaty Fouriera (Fast Fourier Transform; FFT) do mnożenia wielomianów
Zagregowane warianty izotopowe Problem Obliczyć efektywnie q 0, q 1, q 2,... Odpowiedź Np. za pomocą szybkiej transformaty Fouriera (Fast Fourier Transform; FFT) do mnożenia wielomianów zadanie domowe
Zagregowane warianty izotopowe Problem Obliczyć efektywnie q 0, q 1, q 2,... Odpowiedź Np. za pomocą szybkiej transformaty Fouriera (Fast Fourier Transform; FFT) do mnożenia wielomianów zadanie domowe Alternatywne podejście Podejście algebraiczne - algorytm BRAIN (Claesen et al., 2012)
Średnia masa dla wariantów izotopowych m j = k p jk k m jkp jk, gdzie m j to średnia masa j-tego zagregowanego wariantu, a p jk oraz m jk znaczają prawdopodobieństwo i masę k-tego wariantu izotopowego wchodzącego w skład j-tego wariantu zagregowanego.
Nowa funkcja tworząca U(I ; v, w, x, y, z) = j ( ) m jk p jk I j j k q j I j
Nowa funkcja tworząca U(I ; v, w, x, y, z) = j Teraz potrzebujemy obliczyć q j ( ) m jk p jk I j j k q j I j
Q (I, K; v, w, x, y, z) = ( PC12 K M C 12 I 0 + P C13 K M C 13 I 1) v ( PH1 K M H 1 I 0 + P H2 K M H 2 I 1) w ( PN14 K M N 14 I 0 + P N15 K M N 15 I 1) x ( PO16 K M O 16 I 0 + P O17 K M O 17 I 1 + P O18 K M O 18 I 2) y ( PS32 K M S 32 I 0 + P S33 K M S 33 I 1 + P S34 K M S 34 I 2 + P S36 K M S 36 I 4) z, gdzie M C12, M C13,..., M S36 azotu, tlenu oraz siarki to masy izotopów węgla, wodoru,
Wielomian Q (I, K; v, w, x, y, z) możemy wyrazić w następujący sposób: Q (I, K; v, w, x, y, z) ( ) p jk K m jk I j j k
Wielomian Q (I, K; v, w, x, y, z) możemy wyrazić w następujący sposób: Q (I, K; v, w, x, y, z) ( ) p jk K m jk I j j k Następny krok Używamy Q (I, K; v, w, x, y, z) aby uzyskać wielomian U(I ; v, w, x, y, z). K Q (I, K; v, w, x, y, z) = j ( ) m jk p jk K m jk 1 k I j
Podstawiając K = 1 otrzymujemy: U(I ; v, w, x, y, z) = vq(i ; v 1, w, x, y, z) ( P C12 M C12 + P C13 M C13 I 1) +wq(i ; v, w 1, x, y, z) ( P H1 M H1 + P H2 M H2 I 1) +xq(i ; v, w, x 1, y, z) ( P N14 M N14 + P N15 M N15 I 1) +yq(i ; v, w, x, y 1, z) ( P O16 M O16 + P O17 M O17 I 1 + P O18 M O18 I 2) +zq(i ; v, w, x, y, z 1) ( PS32 M S32 + P S33 M S33 I 1 + P S34 M S34 I 2 + P S36 M S36 I 4).
Porównanie z innymi algorytmami źródło: Cleasen et al., 2012, JASMS
Wysokoprzepustowe obliczenia zagregowanych wariantów izotopowych ludzkie białka z bazy Uniprot,
Wysokoprzepustowe obliczenia zagregowanych wariantów izotopowych ludzkie białka z bazy Uniprot, przetwarzanie danych:
Wysokoprzepustowe obliczenia zagregowanych wariantów izotopowych ludzkie białka z bazy Uniprot, przetwarzanie danych: 1. sekwencje C v H w N x O y S z,
Wysokoprzepustowe obliczenia zagregowanych wariantów izotopowych ludzkie białka z bazy Uniprot, przetwarzanie danych: 1. sekwencje C v H w N x O y S z, 2. zagregowane warianty izotopowe,
Wysokoprzepustowe obliczenia zagregowanych wariantów izotopowych ludzkie białka z bazy Uniprot, przetwarzanie danych: 1. sekwencje C v H w N x O y S z, 2. zagregowane warianty izotopowe, w dalszej analizie rozważamy tylko białka o masie monoizotopowej poniżej 10 5 Da,
Wyniki Oś y: Masa monoizotopowa Oś x: różnica między masą najwyższego zagregowanego wariantu a masą monoizotopową
Model liniowy
Residua modelu liniowego
Dodatek: średnia masa dla całej cząsteczki Najprościej obliczyć za pomocą formuły zamkniętej: m = vm C + wm H + xm N + ym O + zm S gdzie m C, m H, m N, m O, m S to średnie masy poszczególnych atomów, np. m C = p C12 m C12 + p C13 m C13 Alternatywnie można też zsumować wszystkie (ew. pomijając warianty o dostatecznie małym prawdopodobieństwie) iloczyny prawdopodobieństw i poszczególnych mas dla wariantów izotopowych
Współpraca Anna Gambin a, Jürgen Claesen b, Tomasz Burzykowski b, Dirk Valkenborg b,c,d a : University of Warsaw, Poland b : Hasselt University, Belgium c : Flemish Institute for Technological Research (VITO), Belgium d : CfP-CeProMa, University of Antwerp, Belgium
Bibliografia Claesen, J, Dittwald, P, Burzykowski, T, Valkenborg, D (2012). An efficient method to calculate the aggregated isotopic distribution and exact center-masses. J. Am. Soc. Mass Spectrom., 23, 4:753-63. Valkenborg, D, Mertens, I, Lemière, F, Witters, E, Burzykowski, T (2012). The isotopic distribution conundrum. Mass Spectrom Rev, 31, 1:96-109. Dittwald, P, Claesen, J, Burzykowski, T, Valkenborg, D, Gambin, A (2013). BRAIN: A Universal Tool for High-Throughput Calculations of the Isotopic Distribution for Mass Spectrometry. Anal. Chem., 85, 4:1991-4.