Metoda identyfikacji modyfikacji potranslacyjnych białek na podstawie danych ze spektrometrii mas

Wielkość: px
Rozpocząć pokaz od strony:

Download "Metoda identyfikacji modyfikacji potranslacyjnych białek na podstawie danych ze spektrometrii mas"

Transkrypt

1 Politechnika Warszawska Wydział Elektroniki i Technik Informacyjnych Instytut Informatyki Rok akademicki 2013/2014 PRACA DYPLOMOWA MAGISTERSKA inż. Katarzyna Maria Paczkowska Metoda identyfikacji modyfikacji potranslacyjnych białek na podstawie danych ze spektrometrii mas Opiekun pracy dr inż. Tymon Rubel Ocena: Podpis Przewodniczącego Komisji Egzaminu Dyplomowego

2 Kierunek: Inżynieria Biomedyczna Data urodzenia: Data rozpoczęcia studiów: Życiorys Urodziłam się w 1988 roku, w Warszawie. W roku 2004 rozpoczęłam naukę w V Liceum Ogólnokształcącym im. Ks. Józefa Poniatowskiego w Warszawie, w klasie o profilu biologiczno-chemiczno-fizycznym. Ukończyłam liceum i zdałam egzamin maturalny w 2007 roku. W październiku tego samego roku rozpoczęłam studia wyższe w Szkole Głównej Gospodarstwa Wiejskiego w Warszawie na kierunku Biologia. W 2010 roku obroniłam licencjat z biologii. W 2009 roku rozpoczęłam równolegle studia wyższe na Politechnice Warszawskiej, na Wydziale Mechatroniki na kierunku Inżynieria Biomedyczna, które obroniłam uzyskując tytuł inżyniera dnia 14-tego lutego 2013 r. Kontynuację studiów na tym samym kierunku podjęłam 20-tego lutego 2013 r. na Wydziale Elektroniki i Technik Informacyjnych. EGZAMIN DYPLOMOWY... Podpis studenta Złożył egzamin dyplomowy w dniu r z wynikiem... Ogólny wynik studiów:... Dodatkowe wnioski i uwagi Komisji:

3 STRESZCZENIE Opracowana została metoda lokalizacji miejsc modyfikacji potranslacyjnych białek na podstawie danych ze spektrometrii mas, oraz implementujący ją program w języku Java. Metoda umożliwia pobranie danych z systemu takiego jak Mascot i uzyskanie wszystkich możliwych wersji zadanej sekwencji oraz obliczenie miary poprawnej lokalizacji modyfikacji dla każdej z nich. Prezentowana praca pozwoliła na przekroczenie ograniczeń istniejących w algorytmach o podobnym zastosowaniu, m.in. pozwala na optymalizację metody obliczania miary poprawnej lokalizacji oraz może analizować wszystkie modyfikacje addytywne. W ramach pracy dokonano optymalizacji parametrów metody i porównano otrzymane wyniki z wynikami systemu Mascot. Dla użytego zestawu danych testowych uzyskano nawet czterokrotne zwiększenie liczby poprawnych lokalizacji dla danego progu FLR (False Localization Ratio). Słowa kluczowe: spektrometria mas, sekwencjonowanie białek, lokalizacja modyfikacji potranslacyjnych The method of identification of post-translational modification of proteins from mass spectrometry data The method of identification of post-translational modifications of proteins on the basis of mass spectrometry data and appropriate software have been developed. The method allows to retrieve data from the system such as Mascot and get all the possible versions of the sequence and to calculate the score of correct localization for each sequence. This work exceeds the limitations of existing algorithms of a similar application, including optimization of score calculation and analyzing all the additive modifications. Within this paper the optimization of the method was done and the results were compared to the results of Mascot system. For the used data set even four times improvement of the number of correct locations for a given threshold FLR (False Localization Ratio) was obtained. Key words: mass spectrometry, sequencing of proteins, post-translational modifications localization

4 Chciałabym podziękować mojemu promotorowi za czas, cierpliwość i ogrom energii, które włożył w pomoc przy realizacji niniejszej pracy.

5 Spis treści 1 Wstęp Cel pracy Układ pracy Proteomika Budowa białek Modyfikacje potranslacyjne białek i ich znaczenie Spektrometria mas Tandemowa spektrometria mas Łączenie chromatografii cieczowej ze spektrometrią mas Identyfikacja białek przy wykorzystaniu spektrometrii mas sprzężonej z chromatografią cieczową (LC-MS/MS) Charakterystyka danych LC-MS/MS Wpływ modyfikacji potranslacyjnych na widmo mas Metody identyfikacji sekwencji peptydów Metody lokalizacji miejsc modyfikacji potranslacyjnych Metoda lokalizacji miejsc modyfikacji potranslacyjnych Charakterystyka metody Opis opracowanego oprogramowania Opis kodu biblioteki Opis programu Integracja z programem MScan

6 6 Wyniki Opis zbioru danych testowych Metoda testowania Wyniki testów Sposób obliczania miary poprawności lokalizacji Wybór uwzględnianych serii pików Użycie serii pików typu neutral loss Sposób wyboru pików z widma pomiarowego Metoda optymalizacji liczby wybieranych pików widma Porównanie uzyskanych wyników z wynikami programu Mascot Podsumowanie Dodatek A Dodatek B opis zawartości płyty Bibliografia Spis rysunków

7 1 Wstęp Odkąd udoskonalono metody badań nad DNA i poznawanie genomów organizmów stało się dostępnym procesem, czego ukoronowaniem było ukończenie Human Genome Project [1], stało się także oczywiste, że nie jest to wystarczające do zrozumienia procesów rządzących życiem organizmów. Następnym krokiem, wymagającym jeszcze bardziej złożonej aparatury i procedur, jest charakterystyka i zrozumienie aktywności białek będących produktem ekspresji genów. Obszarem wiedzy związanym z takimi badaniami jest proteomika [2-4]. Pierwotnie badanie białek ograniczało się do ich oceny w elektroforezie na dwuwymiarowym żelu poliakrylamidowym [5]. Obecnie podstawowym narzędziem proteomiki jest spektrometria mas. Głównymi obszarami zastosowań tej techniki analitycznej są: identyfikacja białek występujących w próbkach biologicznych, odkrywanie i wykorzystanie biomarkerów, badania ilościowe oraz identyfikacja modyfikacji potranslacyjnych [6]. Ostatni z nich jest szczególnie ważny ze względu na znaczący udział modyfikacji potranslacyjnych w istotnych procesach biochemicznych, m.in. związanych z podłożem molekularnym szeregu schorzeń i działaniem wielu leków. Wynika to z faktu, że mechanizmy regulacji w komórce opierają się w dużym stopniu na przekazywaniu sygnałów, w czym ogromną rolę odgrywają modyfikacje potranslacyjne. Struktura białka może być łatwo zmieniana przez kowalencyjne wiązanie z różnego rodzaju grupami funkcyjnymi. Spektrometria mas pozwala odkrywać nowe modyfikacje, określać ich funkcje w komórce, a także dokładnie lokalizować miejsce modyfikacji w białku. Najwięcej uwagi, ze względu na jej ogromną powszechność, poświęca się obecnie fosforylacji, 7

8 jednak istnieje bliżej nieokreślona liczba innych modyfikacji o co najmniej równie dużym znaczeniu. Niniejsza praca poświęcona jest algorytmom analizy danych ze spektrometrii mas pod kątem lokalizacji miejsc modyfikacji potranslacyjnych w łańcuchu białkowym. Jednocześnie stanowi ona element prac nad rozwojem oprogramowania MScan [7] wykorzystywanego w Środowiskowym Laboratorium Spektrometrii Mas Instytutu Biochemii i Biofizyki PAN. 1.1 Cel pracy Celem pracy jest implementacja, optymalizacja parametrów i zbadanie właściwości algorytmu umożliwiającego precyzyjną lokalizację miejsc modyfikacji potranslacyjnych białek na podstawie danych pochodzących z tandemowej spektrometrii mas sprzężonej z chromatografią cieczową. Skuteczność opracowanej metody zostanie oceniona przy użyciu danych z pomiarów proteomicznych i porównana z wynikami uzyskiwanymi przez komercyjny system Mascot [8]. 1.2 Układ pracy W kolejnych rozdziałach niniejszej pracy w skrócie omówiono następujące zagadnienia. W rozdziale 2 postarano się zdefiniować i zakreślić obszar badań w proteomice, przybliżyć strukturę białek i ich znaczenie w organizmach żywych. Następnie opisano kilka rodzajów modyfikacji potranslacyjnych i ich znaczenia. W rozdziale 3 znajduje się zarys budowy tandemowego spektrometru mas sprzężonego z chromatografią cieczową jest to rozwiązanie techniczne, dla którego dedykowane jest omawiane oprogramowanie. W następnym rozdziale opisany jest charakter danych uzyskiwanych na takim spektrometrze i omówione są podejścia do analizy danych we współczesnej proteomice. W rozdziale 5 omówiono zaimplementowaną w programie metodę lokalizacji miejsc modyfikacji potranslacyjnych oraz omówienie opracowanego oprogramowania. W rozdziale 6 zamieszczono wyniki testowania oprogramowania, opis zbioru danych testowych oraz wybranej metody testowania. 8

9 W rozdziale 7 zamieszczono podsumowanie uzyskanych wyników. Na końcu niniejszej pracy znajduje się dodatek z tabelarycznym zestawieniem używanych skrótów oraz podstawowych danych o aminokwasach i modyfikacjach potranslacyjnych. 9

10 2 Proteomika Informacje o budowie i funkcjonowaniu organizmu zawarte są w jego materiale genetycznym, zbudowanym z cząstek kwasu deoksyrybonukleinowego (DNA Deoxyribonucleic acid) [3]. Wszystkie cechy organizmu, czyli jego fenotyp, określony jest przez zestaw genów, czyli genotyp organizmu i podlega kształtowaniu przez czynniki zewnętrzne. Geny ulegają ekspresji, co odbywa się poprzez transkrypcję informacji zawartych w DNA na cząstki kwasu rybonukleinowego (RNA Ribonucleic acid) *, które następnie w procesie translacji stanowią matrycę dla syntezy białek. Ekspresja genów podlega złożonym procesom regulacji, dlatego też w danej komórce i w danej chwili tylko część genów funkcjonuje w postaci swoich białkowych odpowiedników. W genach zapisany jest cały potencjał organizmu, natomiast jego rzeczywiste funkcjonowanie określa obecny w nim zestaw aktywnie działających białek, czyli proteom. Innymi słowy, cała informacja o organizmie zawarta jest w DNA, natomiast większość rzeczywistych zadań wykonywana jest przez białka, nie zaś kwasy nukleinowe [6]. Termin proteom powstał stosunkowo niedawno przez analogię do terminu genom [9]. Istnieją dwa ujęcia tego określenia: (1) proteom jako zestaw wszystkich białek kodowanych przez genom organizmu wraz ze wszystkimi ich możliwymi modyfikacjami potranslacyjnymi, oraz (2) proteom jako zestaw białek i ich modyfikowanych form występujących w komórce w danej chwili. Różnica pomiędzy tym dwoma ujęciami wynika z faktu, że skład białkowy komórki zmienia się w trakcie jej rozwoju, specjalizacji oraz pod wpływem czynników zewnętrznych. Ponieważ ekspresja białek odbywa się * RNA w komórce występuje w kilku odmianach, a produktem transkrypcji DNA jest tylko jedna z nich mrna. Nie jest to przedmiotem niniejszej pracy, dlatego dla uproszczenia używana jest ogólna nazwa RNA. 10

11 z etapem pośrednim, polegającym na transkrypcji DNA na RNA, można mówić także o trzecim poziomie informacji w komórce transkryptomie (RNA). Badaniem genomu zajmuje się genomika, transkryptomu transkryptomika. Przez termin proteomika należy natomiast rozumieć badania stosujące technologie wielkoskalowej separacji i identyfikacji białek. Schematyczny proces ekspresji białek wraz z przypisanymi odpowiednim etapom dziedzinami wiedzy obrazuje rys Rys Schemat procesu ekspresji białek. Etapy ekspresji i dziedziny wiedzy z nimi związane 2.1 Budowa białek Białka są bardzo uniwersalnymi makrocząsteczkami odgrywają rolę w niemal wszystkich procesach biochemicznych, głównie jako katalizatory reakcji [3,10]. Ponadto, w organizmach żywych pełnią różnorodne funkcje, w tym: transportujące, magazynujące, strukturalne i sygnalizacyjne [4]. Ze względu na swą budowę, białka zaliczane są do liniowych polimerów złożonych z mniejszych podjednostek monomerów. Monomerami dla białek są aminokwasy. Zdolność do pełnienia określonej funkcji przez białko zależy od sekwencji aminokwasów oraz od przestrzennej struktury białka, zdeterminowanej przez tą sekwencję. Występujące w przyrodzie aminokwasy stanowią niedużą grupę związków organicznych o wspólnych elementach budowy (rys. 2.2). W położeniu centralnym aminokwasu znajduje się tetraedryczny atom węgla, nazywany też węglem alfa lub węglem centralnym (oznaczany Cα). Połączone z nim są: grupa aminowa, grupa karboksylowa, atom wodoru, łańcuch boczny (grupa R). 11

12 Rys Schemat budowy aminokwasu Powszechnie w białkach występuje 20 aminokwasów różniących się przede wszystkim budową łańcucha bocznego. W najprostszym aminokwasie, glicynie, łańcuch boczny stanowi atom wodoru, ale w ogólności łańcuchy boczne mogą zawierać różne chemiczne grupy funkcyjne, odpowiadające za wiele cech białek. Powszechnie występującym aminokwasom przydzielone są skróty jedno- i trzyliterowe. Tabela tych aminokwasów wraz z przypisanymi im skrótami zamieszczona została w Dodatku (tabela 8.1, str.54). Występowanie w każdym aminokwasie grup aminowej i karboksylowej powoduje, że mogą one łączyć się ze sobą w długie łańcuchy. Grupy aminowa i karboksylowa dwóch aminokwasów reagują ze sobą tworząc wiązanie peptydowe. Reakcja ta należy do reakcji syntezy i przebiega z odłączeniem cząsteczki wody. Schemat powstawania wiązania peptydowego zaprezentowano na rys Rys Schemat powstawania wiązania peptydowego. Zaznaczono tworzącą się cząsteczkę wody oraz nowo powstałe wiązanie peptydowe. Grupy R mogą być dowolne, co zależy od rodzaju aminokwasów wchodzących w reakcję 12

13 Dwa połączone aminokwasy dysponują nadal wolną grupą aminową (nazywaną N-końcem) oraz grupą karboksylową (C-koniec), w związku z czym możliwe jest dalsze przyłączanie aminokwasów do powstającego łańcucha z obu jego stron. Przyjęto, że łańcuch aminokwasów o długości do 10 monomerów nazywa się oligopeptydem, od 10 do 100 aminokwasów peptydem, a powyżej 100 aminokwasów białkiem *. Jednostka aminokwasu wbudowana do łańcucha peptydowego (polipeptydowego) nosi nazwę reszty aminokwasowej. Umownie za początek łańcucha polipeptydowego przyjmuje się jego N-koniec i od tej strony także zapisuje się kolejność reszt aminokwasowych. Białko charakteryzuje się złożonością budowy, którą można rozpatrywać na kilku poziomach. Sekwencja aminokwasów w białku to jego struktura pierwszorzędowa. Ponieważ białko w czasie syntezy zwija się, dochodzi do powstawania struktur bardziej złożonych, określanych jako drugorzędowa i trzeciorzędowa. Jeżeli większe białko składa się z kliku mniejszych białekpodjednostek, wówczas mówimy o jego strukturze czwartorzędowej. Wielopoziomowa i złożona budowa białek pozwala im wyróżnić się spośród innych biocząsteczek ogromną różnorodnością. Przykładowo, dzięki temu, że białka mogą mieć strukturę sztywną lub wykazywać pewną elastyczność, mogą one pełnić różnorodne funkcje budulcowe w organizmach. 2.2 Modyfikacje potranslacyjne białek i ich znaczenie Jak wspomniano, tworzenie się białek jest procesem wieloetapowym [3,10]. Poza transkrypcją i translacją wiele z nich podlega także różnego rodzaju modyfikacjom potranslacyjnym. Pozwalają one wzbogacić zestaw 20 podstawowych aminokwasów o nowe cechy przez przyłączanie grup funkcyjnych do reszt aminokwasowych (wówczas są to tzw. modyfikacje addytywne) lub innego rodzaju zmianę budowy łańcucha polipeptydowego. Przedmiotem niniejszej pracy są modyfikacje addytywne. Do przykładów modyfikacji zaliczyć można acetylację, czyli podstawienie grupy acetylowej (COCH 3 ), w miejsce wodoru; przyłączanie grup hydroksylowych (OH), przyłączanie jednostek węglowodanowych, * Granice te są umowne i różnią się u różnych autorów. 13

14 fosforylację, czyli przyłączenie reszty fosforanowej (H 3 PO 4 ). Kilka ważnych modyfikacji wraz z resztami aminokwasowymi, na których mogą występować oraz ich znaczeniem zebrano w Tab Tab Przykłady modyfikacji potranslacyjnych z resztami aminokwasowymi, na których mogą występować i znaczeniem. Modyfikacja fosforylacja acylacja ubikwitynacja metylacja glikozylacja mostki dwusiarczkowe hydroksylacja Reszta aminokwasowa Tyr (Y) Ser (S) Thr (T) Ala (A) Met (M) Ser (S) Lys (K) Lys (K) Cys (C) Lys (K) Arg (R) Asn (N) Trp (W) Lys (K) Cys (C) Pro (P) Lys (K) Tyr (Y) Przykładowe funkcje Przekazywanie sygnałów komórkowych Kierowanie białek do błony komórkowej Udział w procesie degradacji białek Regulacja transkrypcji DNA Dystrybucja białek w komórce (cząsteczki sygnałowe) Udział w tworzeniu struktury trzeciorzędowej białka Dojrzewanie włókien kolagenowych sulfatacja Tyr (Y) Kierowanie niektórych receptorów białkowych do błony komórkowej Zgodnie z [11] za enzymy przeprowadzające modyfikacje białek odpowiada ok. 5% genomu u wyższych organizmów. U ludzi istnieje ok. 500 kinaz, 150 fosfataz i 500 proteaz * powiązanych z tworzeniem modyfikacji potranslacyjnych. Wśród najważniejszych i najlepiej * Kinazy, fosfatazy i proteazy są rodzajami enzymów. 14

15 scharakteryzowanych rodzajów modyfikacji potranslacyjnych wymienić można fosforylację, acetylację **, glikozylację, metylację i ubikwitynację. Oprócz modyfikacji służących do regulacji życia komórki lub organizmu, istnieje duża grupa modyfikacji szkodliwych, np. powodowanych przez toksyny bakteryjne (m.in. toksynę botulinową). Ich zadaniem jest neutralizowanie mechanizmów obronnych komórki. Poza naturalnymi modyfikacjami aminokwasów wymienić można także modyfikacje o charakterze technicznym, będące wynikiem procesu przygotowania próbek do pomiarów proteomicznych. Nie są one przedmiotem badań, jednak znajdują odbicie w otrzymywanych wynikach. Przykładami takich modyfikacji są: utlenianie metioniny lub kowalencyjna blokada siarki w cysteinie, która pozwala zapobiec wystąpieniu połączeń typu mostek dwusiarczkowy między fragmentami łańcucha. ** Acetylacja jest przykładem acylacji, stąd pojęcia te mogą pojawiać się w tekście zamiennie, choć nie są one równoważne. 15

16 3 Spektrometria mas Spektrometria mas (MS Mass Spectrometry) jest techniką analityczną, służącą do pomiaru mas atomów i cząsteczek [12]. Pomiar w spektrometrii mas wymaga jonizacji i transferu do fazy gazowej, pozwala więc na badanie każdej cząsteczki, którą da się zjonizować [6]. Wartością mierzoną w spektrometrze mas jest stosunek masy do ładunku m/z, gdzie m oznacza wartość względną masy (w odniesieniu do 1 Da * ), a z jest stopniem naładowania jonu [12,13]. Znając stopień naładowania cząstki oraz zmierzoną wartość m/z można wyznaczyć masę. W przypadku jonizacji przez przyłączenie protonów, jak to ma miejsce dla peptydów i białek, zależność pomiędzy wartością m/z, a masą cząstki m 0 wyrażana jest wzorem (3.1): M 0 zm p m0, (3.1) z gdzie: M 0 względna masa cząstki, M masa protonu. p Zastosowanie spektrometrii mas w proteomice stało się możliwe dzięki rozwojowi technik łagodnej jonizacji, która pozwoliła na jonizację dużych i delikatnych biocząsteczek, jakimi są białka. W tym przypadku, jonizacja polega na dodaniu ładunku w postaci jednego lub kilku protonów. Białka i peptydy są polarne, nielotne i wrażliwe na działanie wysokiej temperatury, przez co wymagają metody jonizacji, która pozwoli na transfer do fazy gazowej bez doprowadzenia do ich niekontrolowanej fragmentacji [4]. Wymagania te spełniły jako pierwsze dwie techniki jonizacji, którymi są * Jednostka masy równa 1/12 masy atomu węgla 12 C. Wartość 1 Da, lub inaczej 1 u wynosi 1, (73) kg. 16

17 elektrorozpylanie (ESI ElectroSpray Ionisation) oraz jonizacja przez desorpcję laserową w matrycy (MALDI Matrix Assisted Laser Desorption/Ionization) [6]. W ESI roztwór próbki jest wypuszczany przez cienką igłę pod wysokim napięciem. Skutkiem jest rozpylenie roztworu, a następnie po odparowaniu rozpuszczalnika jonizacja i transfer do fazy gazowej. Ta metoda jonizacji może prowadzić do powstawania jonów obdarzonych wielokrotnym ładunkiem (najczęściej mających 2-3 dodatkowe protony). W metodzie MALDI peptydy mieszane są z rozpuszczalnikiem stanowiącym macierz, która zawiera organiczny kwas absorbujący promieniowanie UV. Jonizacja następuje przez bombardowanie próbki krótkimi pulsami światła UV z lasera. W przypadku tej metody produktem są jony obdarzone zwykle jednokrotnym ładunkiem. ESI i MALDI stanowią źródło jonów, które jest pierwszym elementem konstrukcji spektrometru mas (Rys. 3.1). Jego zadaniem jest nadanie ładunku obojętnym cząsteczkom, dzięki czemu możliwe staje się manipulowanie torem lotu takiej cząsteczki przez zastosowanie pola elektrycznego lub magnetycznego. Rys Spektrometr mas W budowie spektrometru mas można jeszcze wyróżnić dwa podstawowe elementy: analizator i detektor. Zadaniem analizatora jest rozdzielenie cząsteczek pod względem stosunku masy do ładunku (m/z). Istnieje szereg rozwiązań, które pozwalają na wykonywanie tego zadania z różną dokładnością. Wśród nich wymienić należy: analizatory wymuszające ruch jonów po stabilnych orbitach zależnych od wartości m/z pod wpływem pola elektrycznego (IT Ion Trap) lub magnetycznego (Orbitrap oraz ICR Ion Cyclotrone Resonance), analizatory kwadrupolowe, oraz analizatory 17

18 czasu przelotu (TOF Time-Of-Flight). Rozwiązania te różnią się parametrami: zakresem mierzonej masy, szybkością analizy, rozdzielczością, czułością i zakresem dynamicznym dzięki czemu znajdują one szereg różnych zastosowań w proteomice. Popularne są również rozwiązania hybrydowe, które pozwalają łączyć najlepsze cechy w jednym urządzeniu. W detektorze następuje zliczanie jonów o różnych wartościach stosunku m/z, którego wynikiem jest widmo mas. Liczba zliczeń może być wyrażona przez wartości pochodne, np. przez intensywność piku lub względną wysokość wyrażoną w procentach. Przykładowy wykres widma mas zaprezentowano na Rys Rys Widmo mas peptydu Ponieważ pierwiastki w przyrodzie występują w postaci różnych odmian izotopowych, na rzeczywistym widmie mas każdemu jonowi odpowiada seria pików o skończonej szerokości, zależnej od rozdzielczości analizatora (jest to tzw. obwiednia izotopowa). Rozdzielczość analizatora dla pojedynczego piku definiuje równanie: RP m m 0, (3.2) 0 gdzie m0 oznacza szerokość piku w połowie jego wysokości (FWHM Full Width at Half Maximum). 18

19 Dla potrzeb analizy danych wyodrębnia się pik monoizotopowy pochodzący od jonów, których wszystkie atomy reprezentują pierwiastki w podstawowym stanie izotopowym. Jest to pik o najniższej wartości m/z. 3.1 Tandemowa spektrometria mas Budowa klasycznego spektrometru mas pozwala jedynie na określenie składu aminokwasowego próbki. Jednoznaczna identyfikacja tych cząstek wymaga jednak także ustalenia kolejności występowania aminokwasów w sekwencji. Dlatego w ich przypadku wykorzystywane są spektrometry tandemowe, w których wykonywane są dwa cykle analizy, pomiędzy którymi następuje fragmentacja badanej cząstki. Najprostszym rozwiązaniem budowy spektrometru tandemowego jest wzbogacenie zwykłego spektrometru o dodatkowy analizator i komorę kolizyjną. Schemat budowy takiego spektrometru mas prezentuje Rys Rys Schemat budowy tandemowego spektrometru mas Tandemowy spektrometr mas może pracować w trybie MS (klasycznego, nietandemowego spektrometru), gdy komora kolizyjna jest pusta, a pierwszy analizator pełni funkcję kolimatora wiązki jonów. W trybie MS/MS pierwszy analizator pozwala na przepuszczenie jedynie jonów o określonym stosunku masy do ładunku, tzw. jonów macierzystych. Komora kolizyjna wypełniona jest gazem szlachetnym. Przez zderzenia z cząsteczkami gazu jony macierzyste ulegają fragmentacji. W proteomice najbardziej powszechnym typem fragmentacji jest dysocjacja wiązań wywołana kolizją (CID 19

20 Collision Induced Dissociation) przy niskich energiach (<100eV). W takim rozwiązaniu sposób rozpadu jonu macierzystego zależy zarówno od energii kolizji jak i składu aminokwasowego peptydu. Fragmentacja następuje w różnych miejscach łańcucha peptydowego i jej wynikiem jest powstawanie jonów potomnych o różnej długości. W drugim analizatorze możliwe jest otrzymanie widma fragmentacyjnego, czyli widma mas zarejestrowanych w detektorze jonów potomnych. 3.2 Łączenie chromatografii cieczowej ze spektrometrią mas Badanie białek jest nieodłącznie związane z problemem separacji składników niezwykle złożonych próbek biologicznych. Im większy stopień skomplikowania analizowanych próbek, tym mniejsza jest skuteczność identyfikacji znajdujących się w nich białek za pomocą spektrometru mas [4]. Dlatego też w proteomice zwykle wykorzystuje się systemy pomiarowe, w których tandemowy spektrometr mas sprzężony jest z układem wysokosprawnej chromatografii cieczowej (HPLC High Performace Liquid Chromatography). Technika ta, określana jako LC-MS/MS, pozwala w znacznym stopniu poprawić czułość analiz, przez co możliwa staje się badanie nawet białek występujących w niskich stężeniach. Zasada działania HPLC polega na obecności w układzie chromatograficznym dwóch faz: ruchomej i stacjonarnej. Faza stacjonarna wypełnia kolumnę chromatograficzną, natomiast faza ruchoma jest tłoczona pod ciśnieniem wraz z badaną próbką. Składniki mieszaniny, które silniej oddziałują z fazą stacjonarną, pozostają dłużej w układzie, przez co różne składniki opuszczają układ w różnym czasie. Czas między wprowadzeniem do układu analizowanej próbki a pojawieniem się maksimum piku w chromatogramie określany jest całkowitym czasem retencji. Rozdzielanie białek i peptydów w HPLC wykorzystuje różnice w polarności (hydrofilowości) tych biocząsteczek. Rozdzielone w układzie chromatograficznym składniki próbki podawane są na spektrometr mas. 20

21 4 Identyfikacja białek przy wykorzystaniu spektrometrii mas sprzężonej z chromatografią cieczową (LC-MS/MS) Zastosowanie tandemowej spektrometrii mas sprzężonej z chromatografią cieczową pozwoliło na dokładne badanie składu białkowego złożonych próbek biologicznych. Co ważne, możliwa stała się identyfikacja białek nie tylko poprzez określenie ich składu aminokwasowego, ale także wyznaczenie kolejności aminokwasów w łańcuchach, co ma kluczowe znaczenie dla poznania ich właściwości. Aby uprościć zadanie identyfikacji sekwencji białek, próbki poddaje się wstępnemu trawieniu [12]. W tym celu wykorzystuje się specyficzny enzym, jakim jest np. trypsyna, która rozcina wiązanie peptydowe, w którym po karboksylowej stronie znajduje się arginina lub lizyna [3]. Uzyskuje się w ten sposób krótsze sekwencje, z argininą lub lizyną na ostatniej pozycji. Zaletą takiego podejścia jest uzyskanie krótkich cząstek, dla których określenie sekwencji jest dużo łatwiejsze. Jednocześnie jednak wnioskowanie o sekwencji białka odbywa się pośrednio, przez co narażone jest na dodatkowe błędy. Po trawieniu trypsyną stosowany jest wstępny rozdział mieszaniny w systemie HPLC, a następnie mierzone są widma fragmentacyjne peptydów 21

22 na tandemowym spektrometrze mas. Uzyskiwane w ten sposób dane charakteryzują się dużą wymiarowością i znacznym stopniem złożoności. Do ich analizy wykorzystywane są metody automatyczne. 4.1 Charakterystyka danych LC-MS/MS Dane LC-MS/MS złożone są z dużej, dochodzącej do kilkuset tysięcy, liczby widm fragmentacyjnych peptydów pochodzących z trawienia białek z badanej próbki biologicznej. Widma te pozwalają na określenie kolejności występowania aminokwasów tworzących peptydy, jednak ich interpretacja wymaga znajomości sposobu w jaki peptydy ulegają fragmentacji w spektrometrze. Jak wspomniano w rozdziale 3.1, w komorze kolizyjnej spektrometru tandemowego następuje rozdzielenie jonów macierzystych na jony potomne. Przy najczęściej stosowanych energiach kolizji dysocjacja wiązań następuje wzdłuż łańcucha głównego peptydu, w wyniku czego powstają dwa fragmenty. W zależności od miejsca zerwania wiązania jonom przypisane są odpowiednie nazwy. Jony zawierające N-koniec jonu macierzystego nazywane są jonami a, b i c, z kolei te zawierające C-koniec jonami x, y i z. Numeracja jonów związana jest z pozycją reszty aminokwasowej w łańcuchu polipeptydowym. Za początek łańcucha peptydowego przyjmuje się N-koniec. Nazewnictwo i numerację jonów wyjaśnia tabela 4.1 i rys Tab Nazewnictwo jonów potomnych. Nazwy jonów Zerwane wiązanie a, x Wiązanie przed wiązaniem peptydowym, C α C. b, y Wiązanie peptydowe, C N. c, z Wiązanie za wiązaniem peptydowym, N C α. Na rys. 4.1 strzałki wskazują stronę, po której pozostanie ładunek w trakcie jonizacji. Przykładowo, przy rozerwaniu wiązania peptydowego za pierwszym aminokwasem, jeśli ładunek pozostanie po lewej stronie, otrzymamy jon o nazwie b 1, jeśli natomiast ładunek pozostanie po stronie prawej, otrzymamy jon o nazwie y L-1. W przypadku ładunku dwukrotnego, możemy otrzymać jeden z jonów dwukrotnie naładowany lub dwa jony 22

23 naładowane jednokrotnie. W przypadku większego ładunku analogicznie powstawać może większa liczba różnych jonów. Rys Sposób nazewnictwa i numeracji jonów potomnych Na rys. 4.2 widoczne jest teoretyczne widmo z adnotacją pików z serii y oraz b. Jeżeli jony naładowane są jednokrotnie (z = 1), to zgodnie z wzorem (3.1) ich masa co do wartości równa jest stosunkowi m/z pików powiększonemu o masę protonu [14]. Dwóm jonom różniącym się o jedną resztę aminokwasową odpowiadają piki, których wartości m/z różnią się o wartość masy tej reszty aminokwasowej. Różnice w tych wartościach zaznaczono na rys Można porównać je z masą poszczególnych aminokwasów zawartą w tabeli 8.2 (strona 55). W idealnym przypadku w widmie widoczne będą piki odpowiadające jonom powstałym przez rozerwanie kolejnych wiązań peptydowych, czyli znajdzie się tam pik od jonu, w którym obecna była tylko pierwsza reszta aminokwasowa z peptydu, następnie pik od jonu z dwiema resztami, z trzema itd. Odczytując różnice między wartościami m/z kolejnych pików z danej serii odczytać można pełną sekwencję analizowanego peptydu. Zwykle w widmach CID dominują serie b i y. Co za tym idzie, są to serie najczęściej wykorzystywane do analizy [12]. Jeśli w widmie widoczne byłyby wszystkie teoretyczne piki z serii y i b, informacje z obu serii pokrywałyby się, tzn. odczytanie niezależnie serii y i b prowadziłoby do ustalenia tej samej sekwencji. Zwykle jednak nie wszystkie piki są widoczne i obie serie są potrzebne do weryfikacji i uzupełniania wniosków płynących z analizy jednej serii. Oprócz pików opisanych serii podstawowych, w widmie pojawiają się często inne piki pomocne w interpretacji widma. Należą do nich piki z utratą amoniaku (NH 3 ) lub wody (H 2 O) cechujące się masą w przybliżeniu niższą o, odpowiednio: 17 Da i 18 Da. Takie jony skutkują pojawieniem się w widmie pików przesuniętych o wartości m/z odpowiadającym masie 17 lub 18 Da 23

24 Rys Teoretyczne widmo MS/MS peptydu. Widoczne serie jonów y i b. Różnice w intensywności pików są tu przypadkowe. Odległość między dwoma kolejnymi pikami z serii odpowiada masie pojedynczego aminokwasu, pod warunkiem, że seria jest kompletna i zawiera wszystkie możliwe fragmenty uzyskane z jonu macierzystego. Seria y zaczyna się od C-końca peptydu, natomiast seria b od N-końca w stosunku do jonów, które nie utraciły takich cząsteczek. Innymi jonami, rzadziej występującymi w widmach fragmentacyjnych powstałych przy niskich energiach kolizji są tzw. jony wewnętrzne. Powstają one przez zerwanie dwóch wiązań w obrębie łańcucha głównego peptydu. Ich szczególnym przypadkiem są jony immonium, dla których dysocjacja nastąpiła po obu stronach pojedynczej reszty aminokwasowej. Ich pojawienie się w widmie może potwierdzać obecność niektórych aminokwasów w łańcuchu peptydowym. Budowę jonu immonium prezentuje rys Przy wyższych energiach kolizji zrywanie wiązań może występować także w innych miejscach peptydu, np. w obrębie łańcuchów bocznych aminokwasów, jednak powstałe w ten sposób jony nie są wykorzystywane podczas identyfikacji sekwencji. Rys Budowa jonu immonium Na trudność interpretacji widma wpływają fakty takie jak ten, że niektóre wiązania peptydowe cechują się większym prawdopodobieństwem dysocjacji 24

25 niż inne [6]. Odpowiadające im piki mają większą wysokość niż inne, podczas gdy niektóre jony nigdy nie są obserwowane. Prowadzone były badania mające na celu stwierdzenie, które czynniki są ważniejsze w interpretacji widma, jednak wciąż nie istnieje zgodna odpowiedź na to pytanie. 4.2 Wpływ modyfikacji potranslacyjnych na widmo mas Ze względu na metodę analityczną jaką jest spektrometria mas, najważniejszą cechą modyfikacji potranslacyjnych jest ich wpływ na zmianę masy reszty aminokwasowej, na której modyfikacja występuje. Dodanie modyfikacji do którejś z reszt aminokwasowych łańcucha powoduje zmianę masy jonu macierzystego oraz niektórych jonów potomnych. Rys Peptyd z fosforylacją na treoninie (pt). Widoczna w widmie zmiana masy o wartość modyfikacji widoczna będzie na pikach odpowiadających jonom, które zawierają zmodyfikowany aminokwas. Na przykładzie będą to jony od 5 do 9 serii y oraz od 6 do 9 serii b Jak pokazano na rys. 4.4, część jonów potomnych powstałych z rozpadu zmodyfikowanego jonu macierzystego zawiera zmodyfikowany aminokwas, część nie. W serii y wszystkie jony od N-końca aż do miejsca modyfikacji mają zwiększoną masę. W serii b zmiana masy występuje w jonach zaczynając od modyfikacji, aż do C-końca. Zmiany masy jonów potomnych w widmie mas odzwierciedlone są przesuniętymi wartościami m/z odpowiednich pików. Sposób przesunięcia pików można prześledzić na rys. 4.5, gdzie zaprezentowano widma dwóch zmodyfikowanych peptydów. Mają one taką samą sekwencję aminokwasów, ale różne miejsce wystąpienia fosforylacji. Zależność ta wykorzystywana jest do lokalizacji miejsca modyfikacji. 25

26 Rys Widma fragmentacyjne peptydów o tych samych sekwencjach, z różną lokalizacją fosforylacji. Część pików(b 1, y 1, b 6, y 6 ) ma takie same wartości m/z, pozostałe się różnią Poza standardowo wykorzystywanymi pikami serii y i b, ważne ze względu na lokalizację niektórych modyfikacji potranslacyjnych są piki typu neutral loss. Ich powstawanie polega na zmianie schematu fragmentacji peptydu, w którym najpierw od modyfikacji odpada obojętna cząsteczka (ang. neutral loss), której spektrometr nie może zarejestrować. Następnie jon macierzysty o masie pomniejszonej o masę tej cząstki ulega fragmentacji i powstają jony potomne, wśród których każdy zawierający modyfikację ze stratą obojętnej cząstki ma odpowiednio mniejszą masę. Odpadnięcie obojętnej cząstki następuje z pewnym prawdopodobieństwem, stąd w widmie 26

27 pojawiają się piki zwykłe oraz piki jonów o pomniejszonej masie. Przykładowo dla fosforylacji, strata masy tego rodzaju polega na utracie grupy fosforanowej H 3 PO 4, co w widmie widoczne jest jako pik o dużej intensywności przesunięty o wartość 97,977 m/z (zakładając jednokrotny ładunek jonu) w stosunku do jonów bez tej straty masy. Na rys. 4.6 zaprezentowano piki typu neutral loss z zaznaczeniem odpowiadających im pików serii y i b. Rys Widmo fragmentacyjne fosfopeptydu. Widoczne są piki neutral loss (czarne). Strzałka zaczyna się przy piku bez straty masy i wskazuje odpowiadający mu pik, którego wartość m/z została pomniejszona o masę cząstki obojętnej 4.3 Metody identyfikacji sekwencji peptydów Przy obecnym poziomie rozwoju metod tandemowej spektrometrii mas, analizowane mogą być tysiące peptydów w ciągu godziny [6]. Ze względu na złożoność i rozmiar danych w spektrometrii mas, do wnioskowania o budowie białek niezbędne są odpowiednie algorytmy przetwarzania danych [12]. Proces przetwarzania wstępnego danych pomiarowych obejmuje m.in. filtrację dolnoprzepustową, korekcję linii bazowej oraz detekcję pików monoizotopowych. Poddane obróbce widma fragmentacyjne są następnie 27

28 podstawą dla określenia sekwencji peptydów. Na tym etapie najczęściej wykorzystywane są dwie strategie: de novo i podejście bazodanowe. Metoda de novo polega na analizie różnic wartości m/z między pikami i przypisywaniu im możliwych kolejności reszt aminokwasowych [6,12,13]. Metoda ta wymaga korzystania ze znanych reguł fragmentacji i wymaga analizy wszystkich możliwych przypisań pików do jonów. Jest to zadanie bardzo trudne i czasochłonne, bardzo wrażliwe na niedostatki w czułości pomiarów. Podejście bazodanowe, obecnie częściej stosowane, wiąże się z założeniem, że identyfikowane peptydy pochodzą z białek o znanych sekwencjach. W efekcie możliwe jest utworzenie bazy danych teoretycznych widm fragmentacyjnych, wygenerowanych przy użyciu reguł fragmentacji odpowiednich dla używanego sprzętu pomiarowego i parametrów analizy. Identyfikacja sekwencji sprowadza się wówczas do odszukania w bazie danych peptydu o widmie fragmentacyjnym wykazującym największe podobieństwo do rzeczywistego widma MS/MS. Kryterium wyboru jest wartość pewnej miary dopasowania widm, określanej w literaturze anglojęzycznej jako score. Historycznie pierwszym rozwiązaniem tego typu był opublikowany w 1994 roku SEQUEST [14], jednak istnieje szereg innych systemów identyfikacji bazodanowej, różniących się przede wszystkich definicją miary dopasowania widm. Jednym z popularniejszych jest MASCOT [8], który będzie również wykorzystywany w niniejszej pracy. Przy wyznaczaniu score korzysta on z modelu statystycznego uwzględniającego prawdopodobieństwa wystąpień poszczególnych rodzajów jonów fragmentacyjnych. Istnieją także algorytmy łączące podejście de novo z poszukiwaniem podobieństw sekwencji małych fragmentów peptydu w bazach danych. Taki fragment określany jest jako tag, stąd metoda ta nosi nazwę PST Peptide Spectrum Tag. Metoda ta nie została zautomatyzowana i mimo wielu zalet, nie jest powszechnie stosowana. 4.4 Metody lokalizacji miejsc modyfikacji potranslacyjnych Metody analizy danych używane do lokalizacji modyfikacji potranslacyjnych najczęściej wykorzystują podejście bazodanowe. Należy jednak zaznaczyć, 28

29 że typowe systemy identyfikacji, takie jak MASCOT [8] i SEQUEST [14] mają poważne ograniczenia w zakresie dokładnego określania miejsca modyfikacji w obrębie sekwencji peptydu. W ostatnich latach powstało jednak wiele narzędzi dopasowanych stricte do rozwiązywania problemu lokalizacji miejsc modyfikacji potranslacyjnych [15]. Powstały takie narzędzia jak AScore [16], phosphors [17], PTM score [18], czy SLoMo [19], które używają sekwencji zidentyfikowanych przez algorytmy bazodanowe, na podstawie których tworzą listę wszystkich możliwych permutacji lokalizacji miejsc modyfikacji. Następnie dla każdej wersji sekwencji tworzone jest widmo teoretyczne, które dopasowywane jest z pewną tolerancją do widma pomiarowego. Widmo zawiera wybrane serie jonów, które są różne w zależności od algorytmu. Liczone jest prawdopodobieństwo dopasowania danej liczby pików w sposób losowy. W tym celu algorytmy używają zwykle modelu statystycznego najczęściej stosowany jest rozkład dwumianowy lub Poissona. Sposobem prezentacji wyniku obliczeń jest podanie wartości score, wyznaczanej na podstawie tego prawdopodobieństwa. Najczęściej stosowana jest jedna z dwóch strategii: albo metoda jako miarę stosuje score wprost, albo obliczana jest różnica w score uzyskanych przez sekwencje o najwyższych wynikach [15]. Istotnym zagadnieniem jest problem wyboru właściwych pików widma pomiarowego. Oprócz pików informatywnych w widmie mogą znajdować się także piki nie niosące informacji o sekwencji peptydu, np. pochodzące od jonów wewnętrznych, zanieczyszczeń chemicznych badanej próbki lub szumu elektronicznego. Zazwyczaj mają one niższą wysokość, dlatego stosowany może być pewien próg wysokości piku, poniżej którego wszystkie piki są odrzucane. Ponieważ jednak w widmach fragmentacyjnych wysokość pików zależy mocno od zakresu wartości m/z widma (w części środkowej piki są zdecydowanie wyższe), nie stosuje się zwykle jednego progu dla całego widma. Alternatywą jest uwzględnienie jedynie pewnej liczby najwyższych pików, wybranych bezpośrednio z całego widma lub też po jego wcześniejszym podzieleniu na okna o zadanej szerokości. Ponadto, w przypadku problemu lokalizacji miejsc modyfikacji, szczególne jest to, że rozważane są sekwencje identyczne pod względem kolejności aminokwasów. W efekcie, pomiędzy widmami teoretycznymi tych sekwencji istnieje stosunkowo niewiele różnic: wartości m/z wielu pików są identyczne, a tylko część z nich zależy od przypisania modyfikacji do danego 29

30 aminokwasu. Aby umożliwić pojawienie się istotnych różnic w score między sekwencjami, istotny jest proces wyboru pików wskazujących na miejsce modyfikacji. Niektóre algorytmy wyposażone są w podejście pozwalające wybierać z widma piki związane z umiejscowieniem w sekwencji modyfikacji. Mimo opracowania wielu algorytmów, większość z nich ma wiele ograniczeń, wśród których wymienić można: działanie tylko dla jednej modyfikacji fosforylacji, dopasowanie do konkretnego rodzaju analizatora, dopasowanie do konkretnych zasad fragmentacji, dopasowanie do konkretnego systemu bazodanowej identyfikacji. W związku z tym opisywane oprogramowanie jest mało uniwersalne, zwykle wymaga specyficznego formatu danych wejściowych, co utrudnia jego praktyczne wykorzystanie. Ponadto często nie jest ono dostępne publicznie. 30

31 5 Metoda lokalizacji miejsc modyfikacji potranslacyjnych 5.1 Charakterystyka metody Zaproponowany algorytm bazuje na ogólnym schemacie działania metod lokalizacji opisanym w rozdziale 4.4, jednak stara się unikać występujących w innych rozwiązaniach ograniczeń i w związku z tym: jest niezależny od bazowanowego system identyfikacji, obsługuje dowolne modyfikacje zdefiniowane w bazie danych Unimod [20], pozwala na dowolny wybór uwzględnianych serii jonów, w tym neutral loss, jest niezależny od sprzętu pomiarowego, ponieważ pozwala na wybór wartości tolerancji dopasowywania pików widma. Dane wejściowe stanowią fragmentacyjne widma mas oraz sekwencje przypisane im przez system bazodanowy. Ogólny schemat postępowania w trakcie obliczeń jest następujący: 1. Najpierw rozważane są wszystkie możliwe permutacje sekwencji, tzn. ustalona przez system bazodanowy sekwencja z oznaczonymi miejscami modyfikacji stanowi podstawę do utworzenia nowych sekwencji ze zmienionymi miejscami modyfikacji. Generowane są wszystkie możliwe wersje, jak pokazuje przykład na rys

32 Rys Ustalanie możliwych wersji sekwencji. Sekwencja pierwotna ma dwie modyfikacje: fosforylację (p) mogącą tu wystąpić na serynie (S) lub treoninie (T), oraz metylację (m), która może wystąpić w tym przypadku tylko na lizynie (K) 2. Dla każdej wygenerowanej wersji tworzone jest teoretyczne widmo fragmentacyjne na podstawie wybranych przez użytkownika serii pików: jonów y, b i a naładowanych jednokrotnie, jonów y, b i a jonów naładowanych dwukrotnie, jonów ze stratą cząsteczki wody, jonów ze stratą cząsteczki amoniaku, jonów typu neutral loss. 3. W widmie pomiarowym pozostawiana jest tylko pewna liczba pików w literaturze angielskojęzycznej określana jako peak depth. Pozostawiane są tylko najwyższe piki z całego widma lub z jego przedziałów o zadanej szerokości m/z. 4. Każde teoretyczne widmo jest następnie porównywane z widmem pomiarowym w celu dopasowania występujących w nich pików. Odbywa się to poprzez odszukanie takich par pików z obu widm, dla których różnica wartości m/z nie jest większa od zadanej tolerancji, wynikającej z dokładności pomiaru używanego spektrometru. Omawiane w rozdziale 4.4 algorytmy różnią się między sobą podejściem do obliczania prawdopodobieństwa losowego dopasowania pików między widmem rzeczywistym a teoretycznym. Najprostsze przyjmuje założenie, że 32

33 każda wartość masy może wystąpić z takim samym prawdopodobieństwem, a tolerancja jest stała i wynosi ± 0,5 Da. Stąd, jeśli rozważane są 3 piki w oknie o szerokości 100, to prawdopodobieństwo losowego dopasowania piku wynosi 3 na 100. Rozwinięciem tego podejścia jest uwzględnienie tolerancji jako zmiennego parametru. W prezentowanym algorytmie prawdopodobieństwo losowego dopasowania pojedynczego piku p z widma teoretycznego obliczane jest zgodnie z poniższym równaniem: Nd p, (5.1) w gdzie: N całkowita liczba pików pozostawionych w widmie rzeczywistym, w zakres widma. Wynikiem operacji dopasowywania pików jest liczba dopasowań (sukcesów) k. Możliwe jest teraz obliczenie z rozkładu dwumianowego miary prawdopodobieństwa losowego dopasowania widm teoretycznego i rzeczywistego zgodnie z następującym wzorem: P n n k n p 1 p k, (5.2) k k gdzie n oznacza liczbę pików w widmie teoretycznym. Zgodnie z tą procedurą, im niższa otrzymana dla danej wersji sekwencji i dopasowanej liczby pików wartość prawdopodobieństwa, tym dopasowanie takiej liczby pików w sposób losowy było mniej prawdopodobne. Aby uprościć analizę wyników, prawdopodobieństwo P przelicza się na score w sposób zdefiniowany przez następujące równanie: score 10 log P, (5.3) Jednym z ważniejszych parametrów algorytmu jest wartość peak depth. Jednocześnie jest to parametr dość problematyczny, bo zależy od konkretnego widma, trudno więc z góry określić jego wartość. Dlatego też w opisywanym algorytmie jego wartość jest optymalizowana, co przebiega w następujący sposób. Zaczynając od i=1 i zwiększając tę wartość aż do 33

34 pewnej zadanej maksymalnej wartości, tworzone jest przetworzone widmo rzeczywiste z pozostawioną i liczbą pików na przedział o danej szerokości. Następnie przeprowadzany jest proces dopasowywania pozostawionych pików rzeczywistych do widm teoretycznych każdej możliwej wersji sekwencji. Dla każdej wersji sekwencji, dla każdej wartości i obliczane jest prawdopodobieństwo P, oraz score peptydu. Optymalna wartość peak depth wybierana jest tak, aby zmaksymalizować różnice w score między wersjami sekwencji. Przykładowy wynik takich obliczeń pokazano na rys Rys Optymalizacja wybieranej liczby pików na przedział widma rzeczywistego. Wykresy przedstawiają score każdego peptydu przy wybraniu i pików na przedział Aby pokazać jak bardzo jednoznaczna jest wybrana sekwencja, ostateczna wartość wyniku najlepszej sekwencji obliczana może być jako score różnicowy [15]. Jest to wartość różnicy w score między najwyżej punktowaną sekwencją, a drugą w kolejności. Przykładowo, jeśli na podstawie widma rzeczywistego można określić dwie równie prawdopodobne sekwencje, to wynik różnicowy będzie wynosił 0. Oznacza to, że nie ma żadnej pewności, która z dwóch sekwencji może być prawdziwa. 5.2 Opis opracowanego oprogramowania W ramach pracy zrealizowana została biblioteka klas w języku Java realizujących opisany w rozdziale 5.1 algorytm. Wykorzystuje ona biblioteki 34

35 MScanLib, które zapewniają dostęp do danych ze spektrometrii mas. W oparciu o utworzoną bibliotekę powstało oprogramowanie pozwalające zastosować algorytm do danych pochodzących z rzeczywistych badań proteomicznych. Posłużyło ono do wygenerowania wyników zamieszczonych w rozdziale 6.3 niniejszej pracy. Oprogramowanie zostało zintegrowane z programem MScan [7] wykorzystywanym w Instytucie Biochemii i Biofizyki PAN Opis kodu biblioteki Kod klas implementujących algorytm zawarty został w pakiecie mscanlib.ms.msms.ptmscoring.ascore. Klasy te są następujące: AScore, AScoreConfig oraz AScoreResult. Klasa AScore Klasa AScore implementuje główną część algorytmu wraz z różnymi wersjami podejść do jego poszczególnych etapów. Konstruktor klasy wymaga podania sekwencji (obiekt klasy AminoAcidSequence), której różne wersje będą porównywane, widma pomiarowego (obiekt klasy MsMsSpectrum), stopnia naładowania jonu macierzystego oraz obiektu reprezentującego konfigurację (klasy AScoreConfig). Metodą obliczającą wartość score jest metoda computescores(). Kod podzielony jest na metody prywatne realizujące kolejne kroki algorytmu. Najpierw tworzona jest lista możliwych permutacji zadanej sekwencji oraz odpowiadające każdej wersji widmo teoretyczne. Następnie, jeżeli takie jest ustawienie konfiguracji, optymalizowana jest wartość peak depth. Widmo pomiarowe dzielone jest na okna o zadanej szerokości. W tych oknach pozostawiane jest kolejno od 1 do 8 najwyższych pików i tak powstałe widmo dopasowywane jest do widm teoretycznych. Obliczana jest miara poprawności lokalizacji (score) dla każdej wartości peak depth i następuje porównanie wyników. Znajdywana jest taka wartość peak depth, przy której różnice w score różnych wersji sekwencji są największe. Jest to wartość optymalna, i uzyskane z jej użyciem wyniki są zapisywane. Jeśli tak wybrano, ostatecznym wynikiem może być score różnicowy uzyskiwany przez odjęcie najwyższego od drugiego w kolejności wyniku score. Metody dostępowe klasy są następujące. 35

36 getconfig() zwraca obiekt AScoreConfig przechowujący informacje o ustawieniach konfiguracji algorytmu, getresults() pozwala pobrać listę wyników algorytmu, czyli obiektów klasy AScoreResult zawierających wersje sekwencji z przypisanymi im obliczonymi wartościami score, getresults(int) pobiera obiekt klasy AScoreResult z zadanej pozycji na licie wyników (lista jest posortowana), getbestresult() pobiera obiekt klasy AScoreResult zawierający wersję sekwencji o najwyższym score, getbestscore() pobiera tylko wartość score najlepszej sekwencji, getscoredelta() pobiera score różnicowy z listy wyników, getbestsequence() pobiera tylko sekwencję o najwyższym score. Klasa AScoreConfig Klasa AScoreConfig pozwala na przechowywanie zadanych parametrów programu: metody wybierania pików z widma pomiarowego, metody optymalizacji wartości peak depth, liczby pików, gdy nie jest ona optymalizowana oraz maksymalnej liczbę pików, jeśli podlega ona optymalizacji, szerokości przedziałów, na które dzielone jest widmo, zadanej wartości tolerancji dopasowania pików, jednostki tolerancji, listy używanych serii pików, zmiennej logicznej decydującej o użyciu lub nie pików typu neutral loss. Modyfikacja i pobieranie wartości pól klasy odbywa się poprzez standardowe metody dostępowe. Ponadto utworzone zostały także następujące statyczne metody publiczne: getptmscorename(int) zwraca nazwę metody obliczania score przypisaną do danego indeksu typu int, getptmscoreindex(string) zwraca indeks metody obliczania score przypisany do nazwy typu String, getptmscorenames() zwraca nazwy dostępnych metod obliczania score. 36

37 Klasa AScoreResult Klasa AScoreResult służy do tworzenia obiektów przechowujących utworzone wersje sekwencji wraz z policzonymi dla nich wartościami score. Ponadto pozwala na porównywanie i pobieranie najlepszych wyników. Do utworzenia obiektu klasy AScoreResult służy konstruktor pobierający wersję sekwencji, liczbę dopasowanych pików widma teoretycznego do widma pomiarowego, oraz policzoną wartość prawdopodobieństwa zdefiniowaną wzorem (5.2). Na tej podstawie oblicza wartość score zgodnie ze wzorem (5.3). Metody dostępowe klasy są następujące: getscore() zwraca wartość score sekwencji, getmatchedpeakscount() zwraca dopasowaną liczbę pików między widmami teoretycznym i pomiarowym, getp() zwraca wartość prawdopodobieństwa zdefiniowaną dla sekwencji wzorem (5.2), getsequence(), compareto(ascoreresult) pozwala na porównywanie dwóch obiektów typu AScoreResult. Elementami kodu są także klasy z pakietu msms i msms.mass: AminoAcidSequence klasa będąca reprezentacją sekwencji peptydu, PTM klasa reprezentująca modyfikacje, zgodna z bazą UNIMOD [20], MsMsFragmentationTools klasa odpowiedzialna za tworzenie jonów fragmentacyjnych. Szczegółową dokumentację klas publicznych programu zamieszczono na płycie dołączonej do pracy, w katalogu PTMScan\doc Opis programu W ramach pracy powstała aplikacja PTMScan, której zadaniem jest wczytywanie plików w formacie DAT jest to format, w którym zapisywane są pliki wyjściowe systemu Mascot. Zapytania (ang. Query) z pliku wejściowego są sprawdzane pod względem spełniania odpowiednich warunków: akceptowane są jedynie te, którym Mascot przypisał score przekraczający próg istotności i reprezentują sekwencje zawierające więcej 37

38 możliwych miejsc modyfikacji, niż modyfikacji. Dla tych zapytań tworzone są alternatywne wersje sekwencji, przeprowadzana jest optymalizacja wartości peak depth, a następnie generowane są wyniki. Na wyjściu zapisywany jest plik tekstowy, w którym jeden wynik zapisany jest w postaci rekordu, jak pokazuje rys Rys Widok rekordu w pliku wyjściowym programu Jak widać na powyższym rysunku, wyniki dla jednego zapytania są zorganizowane w ten sposób, że najpierw zapisany jest numer zapytania oraz sekwencja wyznaczona przez system Mascot wraz z modyfikacjami i ich pozycjami w sekwencji (numeracja aminokwasów w sekwencji zaczyna się od 0). Następnie zapisywana jest informacja o liczbie wygenerowanych sekwencji. Poniżej znajduje się lista sekwencji z obliczoną wartością score. Na dole rekordu umieszczono informację o wartości score różnicowego (nazwaną tu AScore zgodnie z nazewnictwem wprowadzonym w pracy [16]). Wersja wykonywalna programu w postaci pliku PTMScan.bat została zamieszczona na płycie w katalogu PTMScan wraz z danymi użytymi do testowania (katalog Phospho_HCD). Wywołanie może odbywać się w wierszu poleceń przez użycie komendy PTMScan.bat argument, gdzie argumentem jest katalog zawierający pliki z danymi wejściowymi. Przykład wywołania prezentuje rys

39 Rys Sposób uruchomienia programu PTMScan w wierszu poleceń systemu Windows Integracja z programem MScan Opracowana w ramach pracy biblioteka jest wykorzystywana w oprogramowaniu MScan, używanym w Środowiskowym Laboratorium Spektrometrii Mas IBB PAN. Program umożliwia wyznaczenie prawdopodobieństw lokalizacji dla sekwencji z dowolnymi modyfikacjami zdefiniowanymi w bazie Unimod. Interfejs graficzny pozwala zdefiniować ustawienia algorytmu (wybierane serie pików, sposób wyboru pików, metodę optymalizacji wartości peak depth, tolerancję dopasowywania pików, a także szerokość okna widma, z którego wybierane są piki) i wyświetlić wyniki dla wszystkich możliwych wersji sekwencji z podaniem ich wartości score i liczb dopasowanych pików. Widok okna programu pokazuje rys

40 Rys Okno programu MScan z wyświetloną listą sekwencji wygenerowaną z użyciem opracowanych bibliotek Program pozwala także na wyświetlenie dla każdej wersji sekwencji widma fragmentacyjnego z zaznaczonym wynikiem dopasowania pików widma teoretycznego i rzeczywistego (rys. 5.6). Rys Okno programu MScan z wyświetlonym wynikiem dopasowywania pików widm teoretycznego i rzeczywistego 40

41 6 Wyniki 6.1 Opis zbioru danych testowych Do testowania został użyty zbiór danych testowych udostępniony przez autorów pracy [21]. Zbiór ten został zaprojektowany i zrealizowany w celu badania skuteczności algorytmów określania lokalizacji fosforylacji w sekwencjach peptydów. Peptydy zgromadzone w zbiorze mają dokładnie znane sekwencje i miejsca fosforylacji. Każdy z nich ma więcej potencjalnych miejsc modyfikacji niż faktycznych modyfikacji. W zbiorze znajduje się 180 syntetyczne peptydy oraz ich widma fragmentacyjne uzyskane na tandemowym spektrometrze mas (HPLC- MS/MS). Peptydy utworzone zostały metodą syntezy w fazie stałej według standardowych procedur. Sekwencje zostały zaprojektowane na bazie listy 20 naturalnych fosfopeptydów w ten sposób, aby zawierały 14% reszt serynowych, 6% treoninowych i 5% tyrozynowych, co odpowiada zawartości tych aminokwasów w bazie modyfikacji potranslacyjnych PHOSIDA [22] dla ludzkich fosfopeptydów. Długość peptydów wynosi od 5 do 28 reszt aminokwasowych ze średnią wartością 16 reszt. Pomiarom podlegały pojedyncze peptydy oraz ich mieszaniny sporządzone tak, aby nie występowały w nich peptydy o takiej samej sekwencji i różnych miejscach fosforylacji (izomery). W opisywanym zbiorze peptydów 10% ma więcej niż jedno miejsce fosforylacji. Pozostałe szczegóły przygotowania opisywanego zbioru danych zawarte są w pracy [22]. Widma peptydów zostały poddane identyfikacji z użyciem systemu identyfikacji bazodanowej Mascot. Widmom pomiarowym przypisana została sekwencja wraz ze score obliczonym przez Mascot. Do dalszej analizy brane były tylko sekwencje, dla których score przekraczał próg 41

42 narzucony przez Mascot (peptydy znaczące), oraz posiadały większą liczbę miejsc modyfikacji niż modyfikacji. Zestawienie informacji o wielkości zbioru danych przedstawia tabela 6.1. Tab Zawartość zbioru danych testowych. Całkowita liczba widm 7781 Liczba znaczących peptydów 230 Liczba widm odpowiadających znaczącym peptydom 1253 Liczba znaczących peptydów z wieloma możliwymi miejscami modyfikacji (analizowane) Liczba widm odpowiadających znaczącym peptydom z wieloma możliwymi miejscami modyfikacji (analizowane) Całkowita liczba modyfikacji w analizowanych peptydach 180 Całkowita liczba możliwych miejsc modyfikacji w analizowanych peptydach Metoda testowania Opracowany algorytm został oceniony przez porównanie otrzymanych wyników z wynikami programu Mascot. Aby móc przeprowadzić takie porównanie, najpierw dokonano koniecznej optymalizacji następujących parametrów programu: (1) sposób obliczania miary poprawności lokalizacji czy jest to wynik score dla najwyżej ocenionego peptydu, czy wynik różnicy między score tego peptydu, a kolejnym najwyższym; (2) wybór serii jonów czy analizowane są serie y i b pojedynczo naładowane, seria jonów a, serie podwójnie naładowane, serie jonów z utratą wody lub amoniaku, serie typu neutral loss; (3) sposób wybierania pików w widmie czy wybierane są najwyższe piki z całego widma, czy najwyższe piki w przedziałach widma o zadanej szerokości; (4) liczba wybieranych pików (peak depth) jest optymalizowana oddzielnie dla każdego okna, czy dla wszystkich okien razem. Po wybraniu najlepszych wartości parametrów przeprowadzone zostało porównanie wyników z systemem Mascot. Dla porównania wyników zaprezentowane zostaną histogramy ilości peptydów o różnych wartościach score dla poprawnie i niepoprawnie zlokalizowanych miejsc modyfikacji. Wszystkie prezentowane histogramy 42

43 poddano normalizacji. Im większa część histogramów peptydów prawidłowych i nieprawidłowych się pokrywa, tym trudniejsza jest ocena peptydu na postawie wartości score. Właściwym kryterium jest tutaj wartość FLR (False Localization Ratio) dla różnych wartości progu score. Wartość FLR definiuje wzór (6.1): FL FLR, (6.1) TL FL gdzie: TL True Localization liczba prawidłowo zlokalizowanych miejsc modyfikacji, FL False Localization liczba błędnie zlokalizowanych miejsc modyfikacji. Wartość FLR pokazuje więc, jak wiele fałszywych identyfikacji znalazło się wśród zaakceptowanych wyników przy danym progu score. Zaprezentowane zostaną wykresy liczby prawidłowych lokalizacji w zależności od wartości FLR w najważniejszym, z praktycznego punktu widzenia, zakresie od 0,0 do 0,15. Wyniki będą porównywane pod względem liczby prawidłowych lokalizacji dla trzech wartości progu FLR: 0,01, 0,05 oraz 0, Wyniki testów Sposób obliczania miary poprawności lokalizacji W analizowanych dwóch podejściach miara poprawności lokalizacji obliczana jest najpierw tak samo, zgodnie z wzorami (5.2) i (5.3). W zwykłym podejściu daje to ostateczny wynik score; w podejściu alternatywnym obliczany jest następnie score różnicowy, czyli od wyniku najlepszego odejmowany jest wynik peptydu drugiego w kolejności pod względem wartości score. Dzięki temu uzyskiwana jest dodatkowa informacja o wyniku na tle alternatywnych wersji peptydu. Oba histogramy zaprezentowano na rys Wykres liczby prawidłowych lokalizacji w zależności od FLR prezentuje na rys Zestawienie wyników dla wybranych trzech wartości score prezentuje tabela

44 Rys Histogramy dla score i dla score różnicowego Rys Wykresy prawidłowej liczby lokalizacji od FLR dla score i score różnicowego. Kwadratami zaznaczono punkty wykresu, dla których wartości zebrano w Tab. 6.2 Tab Porównanie liczby prawidłowych lokalizacji dla score i score różnicowego. Całkowita liczba modyfikacji: 981 Liczba poprawnie zlokalizowanych modyfikacji: 793 Liczba nieprawidłowo zlokalizowanych modyfikacji: 188 Wartość progu FLR Liczba prawidłowych lokalizacji score score różnicowy 0, , ,

45 Z porównania zaprezentowanych histogramów wynika, że lepsze rozróżnienie między wynikami prawidłowymi a nieprawidłowymi pozwala uzyskać score różnicowy. Na rys. 6.2 oraz z tabeli 6.2 odczytać można, że liczba prawidłowych lokalizacji jest większa dla score różnicowego niezależnie od wybranego progu FLR. W optymalizacji kolejnych parametrów i przy porównywaniu wyników z wynikami systemu Mascot używany będzie score różnicowy Wybór uwzględnianych serii pików Porównanie wpływu poszczególnych serii jonów na otrzymywane wyniki dokonano przez zestawienie wyników obliczenia z użyciem następujących zestawów serii jonów: y i b jednokrotnie naładowane (oznaczone dalej na wykresach jako y, b), y, b i a jednokrotnie naładowane (ozn. y, b, a), y, b i a jedno- i dwukrotnie naładowane (ozn. y, b, a, ++), y, b i a jedno- i dwukrotnie naładowane, oraz jony ze stratą cząsteczki wody (ozn. y, b, a, ++, -H 2 O), y, b i a jedno- i dwukrotnie naładowane, jony ze stratą wody i jony ze stratą amoniaku (ozn. y, b, a, ++, -H 2 O, -NH 3 ), y, b i a jedno- i dwukrotnie naładowane, jony ze stratą wody, ze stratą amoniaku oraz jony typu neutral loss (ozn. y, b, a, ++, - H 2 O, -NH 3, nl). Rys Liczba prawidłowych lokalizacji modyfikacji potranslacyjnych w zależności od wartości FLR 45

46 Wykres liczby prawidłowych lokalizacji od wartości FLR dla wszystkich wybranych zestawów serii jonów prezentuje rys. 6.3, a zestawienie dla wybranych wartości progowych znajduje się w tabeli 6.3. Tab Porównanie liczby prawidłowych lokalizacji dla zestawów różnych serii jonów. y+, b a y++, b++, a H 2 O NH Liczba poprawnie zlokalizowanych modyfikacji: Wartość progu FLR Liczba prawidłowych lokalizacji 0, , , Porównując wyniki uzyskane dla wybranych zestawów serii jonów zauważyć można, że dodanie niektórych serii poprawia, a innych pogarsza otrzymywane wyniki. Wpływ poszczególnych serii na jakość wyników podsumowano w tabeli 6.4. Tab Wpływ poszczególnych serii jonów na otrzymywane wyniki. Dodana seria jonów Poprawienie ( ) czy pogorszenie ( ) wyników? Czy seria będzie używana? a H 2 O - -NH

47 6.3.3 Użycie serii pików typu neutral loss Po ustaleniu optymalnych serii pików przeanalizowane zostało podejście zakładające użycie także pików z serii neutral loss. Są to piki bardzo charakterystyczne dla niektórych modyfikacji i często są wykorzystywane do rozpoznawania obecności danej modyfikacji w sekwencji [23]. Na rys. 6.4 zaprezentowano porównanie wykresów liczby prawidłowych lokalizacji od wartości FLR dla obliczeń z wykorzystaniem i bez użycia pików z serii neutral loss. W tabeli 6.5 podsumowano uzyskane wyniki dla obu metod. Rys Wykresy prawidłowej liczby lokalizacji od FLR dla wyników z użyciem pików neutral loss i bez nich. Kwadratami zaznaczono punkty wykresu, dla których wartości zebrano w tabeli 6.5 Tab Porównanie liczby prawidłowych lokalizacji przy użyciu serii pików typu neutral loss i bez nich. neutral loss ( ) neutral loss (+) Liczba poprawnie zlokalizowanych modyfikacji: Wartość progu FLR Liczba prawidłowych lokalizacji 0, , ,

48 Dzięki zastosowaniu w obliczeniach pików z serii neutral loss w znacznej części wykresu FLR obserwować można poprawienie wyników. Także całkowita liczba poprawnie zlokalizowanych modyfikacji wzrosła Sposób wyboru pików z widma pomiarowego Porównane zostały dwa podejścia do wyboru pików z widma. Pierwsze z nich zakłada wybór najwyższych pików w całym widmie, drugie natomiast polega na podzieleniu widma na okna o zadanej szerokości (100 m/z) i wyborze najwyższych pików z każdego okna oddzielnie. Wykres zmian liczby prawidłowych lokalizacji dla różnych wartości FLR dla obu podejść prezentuje rys Widoczne jest na nim osiąganie większej liczby prawidłowych lokalizacji przy wyborze pików z podziałem widma na okna. Zaznaczone kwadratami wartości progowe zebrane zostały w tabeli 6.6. Rys Liczba prawidłowych lokalizacji modyfikacji potranslacyjnych w zależności od wartości FLR dla dwóch metod wyboru pików 48

49 Tab Porównanie liczby prawidłowych lokalizacji dla dwóch podejść do wyboru pików widma rzeczywistego. Całe widmo Podział na okna Liczba poprawnie zlokalizowanych modyfikacji: Wartość progu FLR Liczba prawidłowych lokalizacji 0, , , Metoda optymalizacji liczby wybieranych pików widma Rozważone zostały dwa podejścia do optymalizacji. W pierwszym liczba wybieranych pików w oknach optymalizowana jest w taki sposób, że dla każdego okna liczba ta jest taka sama (optymalizacja globalna). Drugie Rys Liczba prawidłowych lokalizacji modyfikacji potranslacyjnych w zależności od wartości FLR dla dwóch metod optymalizacji podejście, wymagające dłuższego czasu obliczeń, optymalizuje liczbę pików dla każdego okna oddzielnie i dopuszcza różną liczbę pików wybieraną w oknach (optymalizacja lokalna). Na rys. 6.6 znajdują się wykresy liczby prawidłowych lokalizacji peptydów w zależności od FLR dla obu podejść. Porównanie wyników zawarto w tabeli

50 Mimo zastosowania dodatkowych obliczeń, metoda wyboru wartości peak depth dla każdego okna indywidualnie nie spowodowała zwiększenia liczby poprawnie lokalizowanych modyfikacji. Widać to w podsumowaniu wyników w tabeli 6.7. W związku z tym rozważana dalej będzie metoda z globalną optymalizacją wartości peak depth. Tab Porównanie liczby prawidłowych lokalizacji dla optymalizacji globalnej i optymalizacji lokalnej. Optymalizacja globalna Optymalizacja lokalna Liczba poprawnie zlokalizowanych modyfikacji: Wartość progu FLR Liczba prawidłowych lokalizacji 0, , , Porównanie uzyskanych wyników z wynikami programu Mascot Po przeprowadzeniu optymalizacji parametrów algorytmu możliwe stało się porównanie uzyskiwanych wyników z wynikami programu Mascot. Histogramy widoczne na rys. 6.7 pokazują zdecydowanie lepszą separację wyników prawidłowych i nieprawidłowych omawianego algorytmu w stosunku do wyników programu Mascot. Rys Histogramy rozkładu score wyników uzyskanych z użyciem programu Mascot oraz opracowanego oprogramowania 50

Proteomika. Spektrometria mas. i jej zastosowanie do badań białek

Proteomika. Spektrometria mas. i jej zastosowanie do badań białek Proteomika Spektrometria mas i jej zastosowanie do badań białek Spektrometria mas (MS) Metoda pozwalająca na pomiar stosunku masy do ładunku jonów (m/z) m/z można przeliczyć na masę jednostką m/z jest

Bardziej szczegółowo

Proteomika. 1. Definicja proteomiki i techniki stosowane w proteomice

Proteomika. 1. Definicja proteomiki i techniki stosowane w proteomice Proteomika 1. Definicja proteomiki i techniki stosowane w proteomice Przepływ informacji, złożoność, *mika DNA RNA Białko Funkcja Genomika Transkryptomika Proteomika Metabolomika Liczba obiektów ~+ ++

Bardziej szczegółowo

Proteomika. Spektrometria mas. i jej zastosowanie do badań białek

Proteomika. Spektrometria mas. i jej zastosowanie do badań białek Proteomika Spektrometria mas i jej zastosowanie do badań białek Spektrometria mas (MS) Metoda pozwalająca na pomiar stosunku masy do ładunku jonów (m/z) m/z można przeliczyć na masę jednostką m/z jest

Bardziej szczegółowo

dobry punkt wyjściowy do analizy nieznanego związku

dobry punkt wyjściowy do analizy nieznanego związku spektrometria mas dobry punkt wyjściowy do analizy nieznanego związku cele: wyznaczenie masy cząsteczkowej związku wyznaczenie wzoru empirycznego określenie fragmentów cząsteczki określenie niedoboru wodoru

Bardziej szczegółowo

etyloamina Aminy mają właściwości zasadowe i w roztworach kwaśnych tworzą jon alkinowy

etyloamina Aminy mają właściwości zasadowe i w roztworach kwaśnych tworzą jon alkinowy Temat: Białka Aminy Pochodne węglowodorów zawierające grupę NH 2 Wzór ogólny amin: R NH 2 Przykład: CH 3 -CH 2 -NH 2 etyloamina Aminy mają właściwości zasadowe i w roztworach kwaśnych tworzą jon alkinowy

Bardziej szczegółowo

Materiały pochodzą z Platformy Edukacyjnej Portalu www.szkolnictwo.pl

Materiały pochodzą z Platformy Edukacyjnej Portalu www.szkolnictwo.pl Materiały pochodzą z Platformy Edukacyjnej Portalu www.szkolnictwo.pl Wszelkie treści i zasoby edukacyjne publikowane na łamach Portalu www.szkolnictwo.pl mogą byd wykorzystywane przez jego Użytkowników

Bardziej szczegółowo

Wybrane techniki badania białek -proteomika funkcjonalna

Wybrane techniki badania białek -proteomika funkcjonalna Wybrane techniki badania białek -proteomika funkcjonalna Proteomika: umożliwia badanie zestawu wszystkich (lub prawie wszystkich) białek komórkowych Zalety analizy proteomu w porównaniu z analizą trankryptomu:

Bardziej szczegółowo

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu

Bardziej szczegółowo

Wybrane techniki badania białek -proteomika funkcjonalna

Wybrane techniki badania białek -proteomika funkcjonalna Wybrane techniki badania białek -proteomika funkcjonalna Proteomika: umożliwia badanie zestawu wszystkich (lub prawie wszystkich) białek komórkowych Zalety analizy proteomu np. w porównaniu z analizą trankryptomu:

Bardziej szczegółowo

Jonizacja plazmą wzbudzaną indukcyjnie (ICP)

Jonizacja plazmą wzbudzaną indukcyjnie (ICP) Jonizacja plazmą wzbudzaną indukcyjnie (ICP) Inductively Coupled Plasma Ionization Opracowane z wykorzystaniem materiałów dr Katarzyny Pawlak z Wydziału Chemicznego PW Schemat spektrometru ICP MS Rozpylacz

Bardziej szczegółowo

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii 1. Technologia rekombinowanego DNA jest podstawą uzyskiwania genetycznie zmodyfikowanych organizmów 2. Medycyna i ochrona zdrowia

Bardziej szczegółowo

Techniki immunochemiczne. opierają się na specyficznych oddziaływaniach między antygenami a przeciwciałami

Techniki immunochemiczne. opierają się na specyficznych oddziaływaniach między antygenami a przeciwciałami Techniki immunochemiczne opierają się na specyficznych oddziaływaniach między antygenami a przeciwciałami Oznaczanie immunochemiczne RIA - ( ang. Radio Immuno Assay) techniki radioimmunologiczne EIA -

Bardziej szczegółowo

Opis przedmiotu zamówienia

Opis przedmiotu zamówienia 1 Załącznik nr 1 do Specyfikacji Istotnych Warunków Zamówienia Opis przedmiotu zamówienia Przedstawione niżej szczegółowe parametry zamawianej aparatury są parametrami minimalnymi. Wykonawca może zaproponować

Bardziej szczegółowo

IDENTYFIKACJA SUBSTANCJI W CHROMATOGRAFII CIECZOWEJ

IDENTYFIKACJA SUBSTANCJI W CHROMATOGRAFII CIECZOWEJ IDENTYFIKACJA SUBSTANCJI W CHROMATOGRAFII CIECZOWEJ Prof. dr hab. inż. Agata Kot-Wasik, prof. zw. PG agawasik@pg.gda.pl 11 Rozdzielenie + detekcja 22 Anality ZNANE Co oznaczamy? Anality NOWE NIEZNANE WWA

Bardziej szczegółowo

Chemiczne składniki komórek

Chemiczne składniki komórek Chemiczne składniki komórek Pierwiastki chemiczne w komórkach: - makroelementy (pierwiastki biogenne) H, O, C, N, S, P Ca, Mg, K, Na, Cl >1% suchej masy - mikroelementy Fe, Cu, Mn, Mo, B, Zn, Co, J, F

Bardziej szczegółowo

Ćwiczenie nr 5 : Badanie licznika proporcjonalnego neutronów termicznych

Ćwiczenie nr 5 : Badanie licznika proporcjonalnego neutronów termicznych Ćwiczenie nr 5 : Badanie licznika proporcjonalnego neutronów termicznych Oskar Gawlik, Jacek Grela 16 lutego 29 1 Teoria 1.1 Licznik proporcjonalny Jest to jeden z liczników gazowych jonizacyjnych, występujący

Bardziej szczegółowo

ZASTOSOWANIA TECHNIK SPEKTROMETRII MAS DO IDENTYFIKACJI I USTALANIA BUDOWY ZWIĄZKÓW ORGANICZNYCH

ZASTOSOWANIA TECHNIK SPEKTROMETRII MAS DO IDENTYFIKACJI I USTALANIA BUDOWY ZWIĄZKÓW ORGANICZNYCH WARSZTATY SPEKTROMETRII MAS Udostępniliśmy dla Państwa slajdy wykładów, które będą prezentowane podczas Kursu. Można je pobrać za pomocą poniższego linku i jeśli jest taka potrzeba wydrukować (nie będziemy

Bardziej szczegółowo

ANALIZA WIDM MASOWYCH OBSŁUGA PROGRAMU DATA ANALYSIS

ANALIZA WIDM MASOWYCH OBSŁUGA PROGRAMU DATA ANALYSIS ANALIZA WIDM MASOWYCH OBSŁUGA PROGRAMU DATA ANALYSIS (Bruker Daltonics) W ramach przedmiotu: Metody fizykochemiczne (L) I rok Mgr Chemia biologiczna Prowadzący: mgr Karolina Radziszewska 1 DATA ANALYSIS

Bardziej szczegółowo

Spektrometria mas (1)

Spektrometria mas (1) pracował: Wojciech Augustyniak Spektrometria mas (1) Spektrometr masowy ma źródło jonów, które jonizuje próbkę Jony wędrują w polu elektromagnetycznym do detektora Metody jonizacji: - elektronowa (EI)

Bardziej szczegółowo

Kombinatoryczna analiza widm 2D-NOESY w spektroskopii Magnetycznego Rezonansu Jądrowego cząsteczek RNA. Marta Szachniuk

Kombinatoryczna analiza widm 2D-NOESY w spektroskopii Magnetycznego Rezonansu Jądrowego cząsteczek RNA. Marta Szachniuk Kombinatoryczna analiza widm 2D-NOESY w spektroskopii Magnetycznego Rezonansu Jądrowego cząsteczek RNA Marta Szachniuk Plan prezentacji Wprowadzenie do tematyki badań Teoretyczny model problemu Złożoność

Bardziej szczegółowo

SPEKTROMETRIA IRMS. (Isotope Ratio Mass Spectrometry) Pomiar stosunków izotopowych (R) pierwiastków lekkich (H, C, O, N, S)

SPEKTROMETRIA IRMS. (Isotope Ratio Mass Spectrometry) Pomiar stosunków izotopowych (R) pierwiastków lekkich (H, C, O, N, S) SPEKTROMETRIA IRMS (Isotope Ratio Mass Spectrometry) Pomiar stosunków izotopowych (R) pierwiastków lekkich (H, C, O, N, S) R = 2 H/ 1 H; 13 C/ 12 C; 15 N/ 14 N; 18 O/ 16 O ( 17 O/ 16 O), 34 S/ 32 S Konstrukcja

Bardziej szczegółowo

Dane mikromacierzowe. Mateusz Markowicz Marta Stańska

Dane mikromacierzowe. Mateusz Markowicz Marta Stańska Dane mikromacierzowe Mateusz Markowicz Marta Stańska Mikromacierz Mikromacierz DNA (ang. DNA microarray) to szklana lub plastikowa płytka (o maksymalnych wymiarach 2,5 cm x 7,5 cm) z naniesionymi w regularnych

Bardziej szczegółowo

DHPLC. Denaturing high performance liquid chromatography. Wiktoria Stańczyk Zofia Kołeczko

DHPLC. Denaturing high performance liquid chromatography. Wiktoria Stańczyk Zofia Kołeczko DHPLC Denaturing high performance liquid chromatography Wiktoria Stańczyk Zofia Kołeczko Mini-słowniczek SNP (Single Nucleotide Polymorphism) - zmienność sekwencji DNA; HET - analiza heterodupleksów; HPLC

Bardziej szczegółowo

Próżnia w badaniach materiałów

Próżnia w badaniach materiałów Próżnia w badaniach materiałów Pomiary ciśnień parcjalnych Konstanty Marszałek Kraków 2011 Analiza składu masowego gazów znajduje coraz większe zastosowanie ze względu na liczne zastosowania zarówno w

Bardziej szczegółowo

Proteomika: umożliwia badanie zestawu wszystkich lub prawie wszystkich białek komórkowych

Proteomika: umożliwia badanie zestawu wszystkich lub prawie wszystkich białek komórkowych Proteomika: umożliwia badanie zestawu wszystkich lub prawie wszystkich białek komórkowych Zalety w porównaniu z analizą trankryptomu: analiza transkryptomu komórki identyfikacja mrna nie musi jeszcze oznaczać

Bardziej szczegółowo

Aminokwasy, peptydy i białka. Związki wielofunkcyjne

Aminokwasy, peptydy i białka. Związki wielofunkcyjne Aminokwasy, peptydy i białka Związki wielofunkcyjne Aminokwasy, peptydy i białka Aminokwasy, peptydy i białka: - wiadomości ogólne Aminokwasy: - ogólna charakterystyka - budowa i nazewnictwo - właściwości

Bardziej szczegółowo

Spektroskopia. Spotkanie pierwsze. Prowadzący: Dr Barbara Gil

Spektroskopia. Spotkanie pierwsze. Prowadzący: Dr Barbara Gil Spektroskopia Spotkanie pierwsze Prowadzący: Dr Barbara Gil Temat rozwaŝań Spektroskopia nauka o powstawaniu i interpretacji widm powstających w wyniku oddziaływań wszelkich rodzajów promieniowania na

Bardziej szczegółowo

TECHNIKI SEPARACYJNE ĆWICZENIE. Temat: Problemy identyfikacji lotnych kwasów tłuszczowych przy zastosowaniu układu GC-MS (SCAN, SIM, indeksy retencji)

TECHNIKI SEPARACYJNE ĆWICZENIE. Temat: Problemy identyfikacji lotnych kwasów tłuszczowych przy zastosowaniu układu GC-MS (SCAN, SIM, indeksy retencji) TECHNIKI SEPARACYJNE ĆWICZENIE Temat: Problemy identyfikacji lotnych kwasów tłuszczowych przy zastosowaniu układu GC-MS (SCAN, SIM, indeksy retencji) Prowadzący: mgr inż. Anna Banel 1 1. Charakterystyka

Bardziej szczegółowo

Przegląd budowy i funkcji białek

Przegląd budowy i funkcji białek Przegląd budowy i funkcji białek Co piszą o białkach? Wyraz wprowadzony przez Jönsa J. Berzeliusa w 1883 r. w celu podkreślenia znaczenia tej grupy związków. Termin pochodzi od greckiego słowa proteios,

Bardziej szczegółowo

Proteomika. Złożoność proteomów

Proteomika. Złożoność proteomów Proteomika Złożoność proteomów Źródła złożoności Złożoność jakościowa pojedynczych białek geny alternatywnie złożone transkrypty, modyfikacje potranslacyjne przycinanie, itp. struktura Oddziaływania z

Bardziej szczegółowo

Kreacja aromatów. Techniki przygotowania próbek. Identyfikacja składników. Wybór składników. Kreacja aromatu

Kreacja aromatów. Techniki przygotowania próbek. Identyfikacja składników. Wybór składników. Kreacja aromatu Kreacja aromatów Techniki przygotowania próbek Identyfikacja składników Wybór składników Kreacja aromatu Techniki przygotowania próbek Ekstrakcja do fazy ciekłej Ekstrakcja do fazy stałej Desorpcja termiczna

Bardziej szczegółowo

Proteomika z wykorzystaniem spektrometrii mas. Pedro Domingues Rosário Domingues Rita Ferreira Tânia Melo Eliana Alves

Proteomika z wykorzystaniem spektrometrii mas. Pedro Domingues Rosário Domingues Rita Ferreira Tânia Melo Eliana Alves Proteomika z wykorzystaniem spektrometrii mas Pedro Domingues Rosário Domingues Rita Ferreira Tânia Melo Eliana Alves Proteom S. Serevisiae Ilość białek (proteom): 5858 Całkowita ilość białek/komórkę:

Bardziej szczegółowo

Substancje o Znaczeniu Biologicznym

Substancje o Znaczeniu Biologicznym Substancje o Znaczeniu Biologicznym Tłuszcze Jadalne są to tłuszcze, które może spożywać człowiek. Stanowią ważny, wysokoenergetyczny składnik diety. Z chemicznego punktu widzenia głównym składnikiem tłuszczów

Bardziej szczegółowo

OZNACZENIE JAKOŚCIOWE I ILOŚCIOWE w HPLC

OZNACZENIE JAKOŚCIOWE I ILOŚCIOWE w HPLC OZNACZENIE JAKOŚCIOWE I ILOŚCIOWE w HPLC prof. Marian Kamiński Wydział Chemiczny, Politechnika Gdańska CEL Celem rozdzielania mieszaniny substancji na poszczególne składniki, bądź rozdzielenia tylko wybranych

Bardziej szczegółowo

Algorytm. Krótka historia algorytmów

Algorytm. Krótka historia algorytmów Algorytm znaczenie cybernetyczne Jest to dokładny przepis wykonania w określonym porządku skończonej liczby operacji, pozwalający na rozwiązanie zbliżonych do siebie klas problemów. znaczenie matematyczne

Bardziej szczegółowo

Analiza i monitoring środowiska

Analiza i monitoring środowiska Analiza i monitoring środowiska CHC 017003L (opracował W. Zierkiewicz) Ćwiczenie 1: Analiza statystyczna wyników pomiarów. 1. WSTĘP Otrzymany w wyniku przeprowadzonej analizy ilościowej wynik pomiaru zawartości

Bardziej szczegółowo

Repetytorium z wybranych zagadnień z chemii

Repetytorium z wybranych zagadnień z chemii Repetytorium z wybranych zagadnień z chemii Mol jest to liczebność materii występująca, gdy liczba cząstek (elementów) układu jest równa liczbie atomów zawartych w masie 12 g węgla 12 C (równa liczbie

Bardziej szczegółowo

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem. Teoria błędów Wskutek niedoskonałości przyrządów, jak również niedoskonałości organów zmysłów wszystkie pomiary są dokonywane z określonym stopniem dokładności. Nie otrzymujemy prawidłowych wartości mierzonej

Bardziej szczegółowo

Wpływ ilości modyfikatora na współczynnik retencji w technice wysokosprawnej chromatografii cieczowej

Wpływ ilości modyfikatora na współczynnik retencji w technice wysokosprawnej chromatografii cieczowej Wpływ ilości modyfikatora na współczynnik retencji w technice wysokosprawnej chromatografii cieczowej WPROWADZENIE Wysokosprawna chromatografia cieczowa (HPLC) jest uniwersalną techniką analityczną, stosowaną

Bardziej szczegółowo

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny

Bardziej szczegółowo

Programowanie celowe #1

Programowanie celowe #1 Programowanie celowe #1 Problem programowania celowego (PC) jest przykładem problemu programowania matematycznego nieliniowego, który można skutecznie zlinearyzować, tzn. zapisać (i rozwiązać) jako problem

Bardziej szczegółowo

Programowanie obiektowe

Programowanie obiektowe Laboratorium z przedmiotu Programowanie obiektowe - zestaw 02 Cel zajęć. Celem zajęć jest zapoznanie z praktycznymi aspektami projektowania oraz implementacji klas i obiektów z wykorzystaniem dziedziczenia.

Bardziej szczegółowo

Wyznaczanie stopnia krystaliczności wybranych próbek polimerów wykorzystanie programu WAXSFIT

Wyznaczanie stopnia krystaliczności wybranych próbek polimerów wykorzystanie programu WAXSFIT 1 ĆWICZENIE 3 Wyznaczanie stopnia krystaliczności wybranych próbek polimerów wykorzystanie programu WAXSFIT Do wyznaczenia stopnia krystaliczności wybranych próbek polimerów wykorzystany zostanie program

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Analiza Organiczna. Jan Kowalski grupa B dwójka 7(A) Własności fizykochemiczne badanego związku. Zmierzona temperatura topnienia (1)

Analiza Organiczna. Jan Kowalski grupa B dwójka 7(A) Własności fizykochemiczne badanego związku. Zmierzona temperatura topnienia (1) Przykład sprawozdania z analizy w nawiasach (czerwonym kolorem) podano numery odnośników zawierających uwagi dotyczące kolejnych podpunktów sprawozdania Jan Kowalski grupa B dwójka 7(A) analiza Wynik przeprowadzonej

Bardziej szczegółowo

Ćwiczenie 3++ Spektrometria promieniowania gamma z licznikiem półprzewodnikowym Ge(Li) kalibracja energetyczna i wydajnościowa

Ćwiczenie 3++ Spektrometria promieniowania gamma z licznikiem półprzewodnikowym Ge(Li) kalibracja energetyczna i wydajnościowa Ćwiczenie 3++ Spektrometria promieniowania gamma z licznikiem półprzewodnikowym Ge(Li) kalibracja energetyczna i wydajnościowa Cel ćwiczenia Celem ćwiczenia jest zapoznanie się - z metodyką pomiaru aktywności

Bardziej szczegółowo

Przybliżone algorytmy analizy ekspresji genów.

Przybliżone algorytmy analizy ekspresji genów. Przybliżone algorytmy analizy ekspresji genów. Opracowanie i implementacja algorytmu analizy danych uzyskanych z eksperymentu biologicznego. 20.06.04 Seminarium - SKISR 1 Wstęp. Dane wejściowe dla programu

Bardziej szczegółowo

Co to jest spektrometria mas?

Co to jest spektrometria mas? Co to jest spektrometria mas? Jest to nowoczesna technika analityczna pozwalająca na dokładne wyznaczenie masy analizowanej substancji Dokładność pomiaru może się wahać od jednego miejsca dziesiętnego

Bardziej szczegółowo

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA SYLABUS DOTYCZY CYKLU KSZTAŁCENIA 2015-2021 1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE Nazwa przedmiotu/ modułu Techniki biologii molekularnej Kod przedmiotu/ modułu* Wydział (nazwa jednostki prowadzącej

Bardziej szczegółowo

Bazy danych TERMINOLOGIA

Bazy danych TERMINOLOGIA Bazy danych TERMINOLOGIA Dane Dane są wartościami przechowywanymi w bazie danych. Dane są statyczne w tym sensie, że zachowują swój stan aż do zmodyfikowania ich ręcznie lub przez jakiś automatyczny proces.

Bardziej szczegółowo

OFERTA TEMATÓW PROJEKTÓW DYPLOMOWYCH (MAGISTERSKICH) do zrealizowania w Katedrze INŻYNIERII CHEMICZNEJ I PROCESOWEJ

OFERTA TEMATÓW PROJEKTÓW DYPLOMOWYCH (MAGISTERSKICH) do zrealizowania w Katedrze INŻYNIERII CHEMICZNEJ I PROCESOWEJ OFERTA TEMATÓW PROJEKTÓW DYPLOMOWYCH (MAGISTERSKICH) do zrealizowania w Katedrze INŻYNIERII CHEMICZNEJ I PROCESOWEJ Badania kinetyki utleniania wybranych grup związków organicznych podczas procesów oczyszczania

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych...

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych... Przedmowa... XI Część pierwsza Wprowadzenie i biologiczne bazy danych 1 Wprowadzenie... 3 Czym jest bioinformatyka?... 5 Cele... 5 Zakres zainteresowań... 6 Zastosowania... 7 Ograniczenia... 8 Przyszłe

Bardziej szczegółowo

Informacje. W sprawach organizacyjnych Slajdy z wykładów

Informacje. W sprawach organizacyjnych Slajdy z wykładów Biochemia Informacje W sprawach organizacyjnych malgorzata.dutkiewicz@wum.edu.pl Slajdy z wykładów www.takao.pl W sprawach merytorycznych Takao Ishikawa (takao@biol.uw.edu.pl) Kiedy? Co? Kto? 24 lutego

Bardziej szczegółowo

Ćwiczenie LP2. Jacek Grela, Łukasz Marciniak 25 października 2009

Ćwiczenie LP2. Jacek Grela, Łukasz Marciniak 25 października 2009 Ćwiczenie LP2 Jacek Grela, Łukasz Marciniak 25 października 2009 1 Wstęp teoretyczny 1.1 Energetyczna zdolność rozdzielcza Energetyczna zdolność rozdzielcza to wielkość opisująca dokładność detekcji energii

Bardziej szczegółowo

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych autor: Robert Drab opiekun naukowy: dr inż. Paweł Rotter 1. Wstęp Zagadnienie generowania trójwymiarowego

Bardziej szczegółowo

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego O O

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego O O Zastosowanie spektrometrii mas do określania struktury związków organicznych (opracowała Anna Kolasa) Uwaga: Informacje na temat nowych technik jonizacji, budowy analizatorów, nowych metod detekcji jonów

Bardziej szczegółowo

Scenariusz lekcji chemii w klasie III gimnazjum. Temat lekcji: Białka skład pierwiastkowy, budowa, właściwości i reakcje charakterystyczne

Scenariusz lekcji chemii w klasie III gimnazjum. Temat lekcji: Białka skład pierwiastkowy, budowa, właściwości i reakcje charakterystyczne Scenariusz lekcji chemii w klasie III gimnazjum Temat lekcji: Białka skład pierwiastkowy, budowa, właściwości i reakcje charakterystyczne Czas trwania lekcji: 2x 45 minut Cele lekcji: 1. Ogólny zapoznanie

Bardziej szczegółowo

ZASTOSOWANIA SPEKTROMETRII MAS W CHEMII ORGANICZNEJ I BIOCHEMII WYKŁAD I PODSTAWY SPEKTROMETRII MAS

ZASTOSOWANIA SPEKTROMETRII MAS W CHEMII ORGANICZNEJ I BIOCHEMII WYKŁAD I PODSTAWY SPEKTROMETRII MAS ZASTOSOWANIA SPEKTROMETRII MAS W CHEMII ORGANICZNEJ I BIOCHEMII WYKŁAD I PODSTAWY SPEKTROMETRII MAS ZAKRESY PROMIENIOWANIA ELEKTROMAGNETYCZNEGO, WYKORZYSTYWANEGO WNAJWAŻNIEJSZYCH METODACH SPEKTRALNYCH

Bardziej szczegółowo

Pomiar rezystancji metodą techniczną

Pomiar rezystancji metodą techniczną Pomiar rezystancji metodą techniczną Cel ćwiczenia. Poznanie metod pomiarów rezystancji liniowych, optymalizowania warunków pomiaru oraz zasad obliczania błędów pomiarowych. Zagadnienia teoretyczne. Definicja

Bardziej szczegółowo

Wyznaczanie stopnia krystaliczności wybranych próbek polimerów wykorzystanie programu WAXSFIT

Wyznaczanie stopnia krystaliczności wybranych próbek polimerów wykorzystanie programu WAXSFIT 1 ĆWICZENIE 3 Wyznaczanie stopnia krystaliczności wybranych próbek polimerów wykorzystanie programu WAXSFIT Do wyznaczenia stopnia krystaliczności wybranych próbek polimerów wykorzystany zostanie program

Bardziej szczegółowo

Wysokosprawna chromatografia cieczowa dobór warunków separacji wybranych związków

Wysokosprawna chromatografia cieczowa dobór warunków separacji wybranych związków Wysokosprawna chromatografia cieczowa dobór warunków separacji wybranych związków Instrukcja do ćwiczeń opracowana w Katedrze Chemii Środowiska Uniwersytetu Łódzkiego Opis programu do ćwiczeń Po włączeniu

Bardziej szczegółowo

Narodowe Centrum Badań Jądrowych Dział Edukacji i Szkoleń ul. Andrzeja Sołtana 7, Otwock-Świerk

Narodowe Centrum Badań Jądrowych Dział Edukacji i Szkoleń ul. Andrzeja Sołtana 7, Otwock-Świerk Narodowe Centrum Badań Jądrowych Dział Edukacji i Szkoleń ul. Andrzeja Sołtana 7, 05-400 Otwock-Świerk ĆWICZENIE L A B O R A T O R I U M F I Z Y K I A T O M O W E J I J Ą D R O W E J Zastosowanie pojęć

Bardziej szczegółowo

Nowoczesne systemy ekspresji genów

Nowoczesne systemy ekspresji genów Nowoczesne systemy ekspresji genów Ekspresja genów w organizmach żywych GEN - pojęcia podstawowe promotor sekwencja kodująca RNA terminator gen Gen - odcinek DNA zawierający zakodowaną informację wystarczającą

Bardziej szczegółowo

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II 10 października 2013: Elementarz biologii molekularnej www.bioalgorithms.info Wykład nr 2 BIOINFORMATYKA rok II Komórka: strukturalna i funkcjonalne jednostka organizmu żywego Jądro komórkowe: chroniona

Bardziej szczegółowo

Slajd 1. Slajd 2. Proteiny. Peptydy i białka są polimerami aminokwasów połączonych wiązaniem amidowym (peptydowym) Kwas α-aminokarboksylowy aminokwas

Slajd 1. Slajd 2. Proteiny. Peptydy i białka są polimerami aminokwasów połączonych wiązaniem amidowym (peptydowym) Kwas α-aminokarboksylowy aminokwas Slajd 1 Proteiny Slajd 2 Peptydy i białka są polimerami aminokwasów połączonych wiązaniem amidowym (peptydowym) wiązanie amidowe Kwas α-aminokarboksylowy aminokwas Slajd 3 Aminokwasy z alifatycznym łańcuchem

Bardziej szczegółowo

RMSD - Ocena jakości wybranych molekularnych struktur przestrzennych

RMSD - Ocena jakości wybranych molekularnych struktur przestrzennych RMSD - Ocena jakości wybranych molekularnych struktur przestrzennych Joanna Wiśniewska Promotor: dr inż. P. Łukasiak Spis treści 1. Zakres pracy magisterskiej 2. Struktura białka 3. Struktura kwasów nukleionowych

Bardziej szczegółowo

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji. Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie

Bardziej szczegółowo

POLITECHNIKA WARSZAWSKA. Wydział Elektroniki i Technik Informacyjnych ROZPRAWA DOKTORSKA. mgr inż. Tymon Rubel

POLITECHNIKA WARSZAWSKA. Wydział Elektroniki i Technik Informacyjnych ROZPRAWA DOKTORSKA. mgr inż. Tymon Rubel POLITECHNIKA WARSZAWSKA Wydział Elektroniki i Technik Informacyjnych ROZPRAWA DOKTORSKA mgr inż. Tymon Rubel Wybrane metody analizy danych w proteomice. Promotor prof. nzw. dr hab. inż. Krzysztof Zaremba

Bardziej szczegółowo

Automatyczna klasyfikacja zespołów QRS

Automatyczna klasyfikacja zespołów QRS Przetwarzanie sygnałów w systemach diagnostycznych Informatyka Stosowana V Automatyczna klasyfikacja zespołów QRS Anna Mleko Tomasz Kotliński AGH EAIiE 9 . Opis zadania Tematem projektu było zaprojektowanie

Bardziej szczegółowo

Wykład 14 Biosynteza białek

Wykład 14 Biosynteza białek BIOCHEMIA Kierunek: Technologia Żywności i Żywienie Człowieka semestr III Wykład 14 Biosynteza białek WYDZIAŁ NAUK O ŻYWNOŚCI I RYBACTWA CENTRUM BIOIMMOBILIZACJI I INNOWACYJNYCH MATERIAŁÓW OPAKOWANIOWYCH

Bardziej szczegółowo

Spektroskopia magnetycznego rezonansu jądrowego - wprowadzenie

Spektroskopia magnetycznego rezonansu jądrowego - wprowadzenie Spektroskopia magnetycznego rezonansu jądrowego - wprowadzenie Streszczenie Spektroskopia magnetycznego rezonansu jądrowego jest jedną z technik spektroskopii absorpcyjnej mającej zastosowanie w chemii,

Bardziej szczegółowo

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery http://xqtav.sourceforge.net XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery dr hab. Jerzy Tyszkiewicz dr Andrzej Kierzek mgr Jacek Sroka Grzegorz Kaczor praca mgr pod

Bardziej szczegółowo

PLAN STUDIÓW PODYPLOMOWYCH: DIAGNOSTYKA MOLEKULARNA W ROKU 2019/2020. Nazwa modułu ECTS Semestr I Semestr II. Liczba godzin z.

PLAN STUDIÓW PODYPLOMOWYCH: DIAGNOSTYKA MOLEKULARNA W ROKU 2019/2020. Nazwa modułu ECTS Semestr I Semestr II. Liczba godzin z. Załącznik nr 5 do uchwały nr 79/2018-2019 Senatu Uniwersytetu Przyrodniczego w Lublinie z dnia 24 maja 2019 r. Symbol modułu PLAN STUDIÓW PODYPLOMOWYCH: DIAGNOSTYKA MOLEKULARNA W ROKU 2019/2020 Nazwa modułu

Bardziej szczegółowo

Ćwiczenie ELE. Jacek Grela, Łukasz Marciniak 3 grudnia Rys.1 Schemat wzmacniacza ładunkowego.

Ćwiczenie ELE. Jacek Grela, Łukasz Marciniak 3 grudnia Rys.1 Schemat wzmacniacza ładunkowego. Ćwiczenie ELE Jacek Grela, Łukasz Marciniak 3 grudnia 2009 1 Wstęp teoretyczny 1.1 Wzmacniacz ładunkoczuły Rys.1 Schemat wzmacniacza ładunkowego. C T - adaptor ładunkowy, i - źródło prądu reprezentujące

Bardziej szczegółowo

Metody badania ekspresji genów

Metody badania ekspresji genów Metody badania ekspresji genów dr Katarzyna Knapczyk-Stwora Warunki wstępne: Proszę zapoznać się z tematem Metody badania ekspresji genów zamieszczonym w skrypcie pod reakcją A. Lityńskiej i M. Lewandowskiego

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

Algorytmy genetyczne. Paweł Cieśla. 8 stycznia 2009

Algorytmy genetyczne. Paweł Cieśla. 8 stycznia 2009 Algorytmy genetyczne Paweł Cieśla 8 stycznia 2009 Genetyka - nauka o dziedziczeniu cech pomiędzy pokoleniami. Geny są czynnikami, które decydują o wyglądzie, zachowaniu, rozmnażaniu każdego żywego organizmu.

Bardziej szczegółowo

2.2 Opis części programowej

2.2 Opis części programowej 2.2 Opis części programowej Rysunek 1: Panel frontowy aplikacji. System pomiarowy został w całości zintegrowany w środowisku LabVIEW. Aplikacja uruchamiana na komputerze zarządza przebiegiem pomiarów poprzez

Bardziej szczegółowo

Szkoła z przyszłością. Zastosowanie pojęć analizy statystycznej do opracowania pomiarów promieniowania jonizującego

Szkoła z przyszłością. Zastosowanie pojęć analizy statystycznej do opracowania pomiarów promieniowania jonizującego Szkoła z przyszłością szkolenie współfinansowane przez Unię Europejską w ramach Europejskiego Funduszu Społecznego Narodowe Centrum Badań Jądrowych, ul. Andrzeja Sołtana 7, 05-400 Otwock-Świerk ĆWICZENIE

Bardziej szczegółowo

WPŁYW ILOŚCI MODYFIKATORA NA WSPÓŁCZYNNIK RETENCJI W TECHNICE WYSOKOSPRAWNEJ CHROMATOGRAFII CIECZOWEJ

WPŁYW ILOŚCI MODYFIKATORA NA WSPÓŁCZYNNIK RETENCJI W TECHNICE WYSOKOSPRAWNEJ CHROMATOGRAFII CIECZOWEJ WPŁYW ILOŚCI MODYFIKATORA NA WSPÓŁCZYNNIK RETENCJI W TECHNICE WYSOKOSPRAWNEJ CHROMATOGRAFII CIECZOWEJ Wprowadzenie Wysokosprawna chromatografia cieczowa (HPLC) jest uniwersalną technika analityczną, stosowaną

Bardziej szczegółowo

Metody chemiczne w analizie biogeochemicznej środowiska. (Materiał pomocniczy do zajęć laboratoryjnych)

Metody chemiczne w analizie biogeochemicznej środowiska. (Materiał pomocniczy do zajęć laboratoryjnych) Metody chemiczne w analizie biogeochemicznej środowiska. (Materiał pomocniczy do zajęć laboratoryjnych) Metody instrumentalne podział ze względu na uzyskane informację. 1. Analiza struktury; XRD (dyfrakcja

Bardziej szczegółowo

JAK WYZNACZA SIĘ PARAMETRY WALIDACYJNE

JAK WYZNACZA SIĘ PARAMETRY WALIDACYJNE JAK WYZNACZA SIĘ PARAMETRY WALIDACYJNE 1 Granica wykrywalności i granica oznaczalności Dr inż. Piotr KONIECZKA Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska ul. G. Narutowicza 11/12

Bardziej szczegółowo

Materiał obowiązujący do ćwiczeń z analizy instrumentalnej II rok OAM

Materiał obowiązujący do ćwiczeń z analizy instrumentalnej II rok OAM Materiał obowiązujący do ćwiczeń z analizy instrumentalnej II rok OAM Ćwiczenie 1 Zastosowanie statystyki do oceny metod ilościowych Błąd gruby, systematyczny, przypadkowy, dokładność, precyzja, przedział

Bardziej szczegółowo

Przemiana materii i energii - Biologia.net.pl

Przemiana materii i energii - Biologia.net.pl Ogół przemian biochemicznych, które zachodzą w komórce składają się na jej metabolizm. Wyróżnia się dwa antagonistyczne procesy metabolizmu: anabolizm i katabolizm. Szlak metaboliczny w komórce, to szereg

Bardziej szczegółowo

Roztwory buforowe (bufory) (opracowanie: dr Katarzyna Makyła-Juzak)

Roztwory buforowe (bufory) (opracowanie: dr Katarzyna Makyła-Juzak) Roztwory buforowe (bufory) (opracowanie: dr Katarzyna Makyła-Juzak) 1. Właściwości roztworów buforowych Dodatek nieznacznej ilości mocnego kwasu lub mocnej zasady do czystej wody powoduje stosunkowo dużą

Bardziej szczegółowo

ĆWICZENIE 15 BADANIE WZMACNIACZY MOCY MAŁEJ CZĘSTOTLIWOŚCI

ĆWICZENIE 15 BADANIE WZMACNIACZY MOCY MAŁEJ CZĘSTOTLIWOŚCI 1 ĆWICZENIE 15 BADANIE WZMACNIACZY MOCY MAŁEJ CZĘSTOTLIWOŚCI 15.1. CEL ĆWICZENIA Celem ćwiczenia jest poznanie podstawowych właściwości wzmacniaczy mocy małej częstotliwości oraz przyswojenie umiejętności

Bardziej szczegółowo

Bioinformatyka Laboratorium, 30h. Michał Bereta

Bioinformatyka Laboratorium, 30h. Michał Bereta Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecnośd Literatura, materiały i ewolucja molekularna

Bardziej szczegółowo

Spis treści. Analiza i modelowanie_nowicki, Chomiak_Księga1.indb :03:08

Spis treści. Analiza i modelowanie_nowicki, Chomiak_Księga1.indb :03:08 Spis treści Wstęp.............................................................. 7 Część I Podstawy analizy i modelowania systemów 1. Charakterystyka systemów informacyjnych....................... 13 1.1.

Bardziej szczegółowo

SCENARIUSZ LEKCJI. Dzielenie wielomianów z wykorzystaniem schematu Hornera

SCENARIUSZ LEKCJI. Dzielenie wielomianów z wykorzystaniem schematu Hornera Autorzy scenariusza: SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH

Bardziej szczegółowo

Laboratorium Optyki Falowej

Laboratorium Optyki Falowej Marzec 2019 Laboratorium Optyki Falowej Instrukcja do ćwiczenia pt: Filtracja optyczna Opracował: dr hab. Jan Masajada Tematyka (Zagadnienia, które należy znać przed wykonaniem ćwiczenia): 1. Obraz fourierowski

Bardziej szczegółowo

Algorytmy genetyczne

Algorytmy genetyczne 9 listopada 2010 y ewolucyjne - zbiór metod optymalizacji inspirowanych analogiami biologicznymi (ewolucja naturalna). Pojęcia odwzorowujące naturalne zjawiska: Osobnik Populacja Genotyp Fenotyp Gen Chromosom

Bardziej szczegółowo

Podstawowe pojęcia i prawa chemiczne, Obliczenia na podstawie wzorów chemicznych

Podstawowe pojęcia i prawa chemiczne, Obliczenia na podstawie wzorów chemicznych Podstawowe pojęcia i prawa chemiczne, Obliczenia na podstawie wzorów chemicznych 1. Wielkości i jednostki stosowane do wyrażania ilości materii 1.1 Masa atomowa, cząsteczkowa, mol Masa atomowa Atomy mają

Bardziej szczegółowo

Wysokosprawna chromatografia cieczowa w analizie jakościowej i ilościowej

Wysokosprawna chromatografia cieczowa w analizie jakościowej i ilościowej Wysokosprawna chromatografia cieczowa w analizie jakościowej i ilościowej W analizie ilościowej z zastosowaniem techniki HPLC wykorzystuje się dwa możliwe schematy postępowania: kalibracja zewnętrzna sporządzenie

Bardziej szczegółowo

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Program V-SIM tworzenie plików video z przebiegu symulacji

Program V-SIM tworzenie plików video z przebiegu symulacji Program V-SIM tworzenie plików video z przebiegu symulacji 1. Wprowadzenie Coraz częściej zdarza się, że zleceniodawca opinii prosi o dołączenie do opracowania pliku/ów Video z zarejestrowanym przebiegiem

Bardziej szczegółowo

Rozkład Gaussa i test χ2

Rozkład Gaussa i test χ2 Rozkład Gaussa jest scharakteryzowany dwoma parametramiwartością oczekiwaną rozkładu μ oraz dyspersją σ: METODA 2 (dokładna) polega na zmianie zmiennych i na obliczeniu pk jako różnicy całek ze standaryzowanego

Bardziej szczegółowo

Zajęcia wprowadzające W-1 termin I temat: Sposób zapisu wyników pomiarów

Zajęcia wprowadzające W-1 termin I temat: Sposób zapisu wyników pomiarów wielkość mierzona wartość wielkości jednostka miary pomiar wzorce miary wynik pomiaru niedokładność pomiaru Zajęcia wprowadzające W-1 termin I temat: Sposób zapisu wyników pomiarów 1. Pojęcia podstawowe

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

Metody analizy pierwiastków z zastosowaniem wtórnego promieniowania rentgenowskiego. XRF, SRIXE, PIXE, SEM (EPMA)

Metody analizy pierwiastków z zastosowaniem wtórnego promieniowania rentgenowskiego. XRF, SRIXE, PIXE, SEM (EPMA) Metody analizy pierwiastków z zastosowaniem wtórnego promieniowania rentgenowskiego. XRF, SRIXE, PIXE, SEM (EPMA) Promieniowaniem X nazywa się promieniowanie elektromagnetyczne o długości fali od około

Bardziej szczegółowo