Metody bioinformatyki Wprowadzenie do bioinformatyki prof. dr hab. Jan Mulawka
Czym jest bioinformatyka Bioinformatyka to dyscyplina zajmująca się stosowaniem narzędzi matematycznych i informatycznych do rozwiązywania problemów z nauk biologicznych Bioinformatyka jest nauką interdyscyplinarną, która integruje: biologię molekularną, informatykę, matematykę, genetykę, teorię baz danych, biologię strukturalną, oraz biochemię Bioinformatyka rozwiązuje problemy nagromadzone w wyniku intensywnego rozwoju nauk przyrodniczych przy użyciu metodologii nauk informatycznych
Termin "bioinformatyka" po raz pierwszy został użyty przez Masys'a w 1989 roku Naukowcy przetworzyli już ogromne ilości danych opisujących odczytane sekwencje par zasad A, C, T i G. Badacze tworzą obecnie wielkie bazy danych dotyczące miejsca i czasu aktywacji poszczególnych genów, struktury kodowanych przez nie białek, ich wzajemnego oddziaływania oraz roli, jaką owe interakcje pełnią w różnego rodzaju chorobach Z mariażu biologii i informatyki narodziła się bioinformatyka
Bioinformatyka obejmuje kilka dyscyplin i metodologii: Biologię molekularną Genomikę Proteomikę Metabolomikę Nutrigenomikę Modelowanie działania mózgu (BCI) Komputerowe projektowanie leków (CADD) Badania komputerowe (DNA Computing) Aplikacje i bazy danych Zarządzania informacją/ Technologię Informacyjną
Rynek bioinformatyczny Szacuje się, że obecnie na rynku funkcjonuje ponad 50 przedsiębiorstw oferujących swoje produkty i usługi bioinformatyczne potencjalnym klientom. Szacunkowo wartość całkowita rynku narzędzi i usług bioinformatycznych, włączając w to klasyczne bazy danych, może przewyższyć 2.0 miliardy USD w ciągu pięciu lat Grupy zajmujące się badaniami rynkowymi: Frontline i Frost & Sullivan, na podstawie przeglądu ponad 50 programów komputerowych i bioinformatycznych baz danych różnych przedsiębiorstw, oszacowały aktualny rynek w przybliżeniu na 300 milionów dolarów
Kategorie bioinformatyki Bioinformatyka, jako nauka w aktualnym stanie może zostać podzielona na dwie kategorie: producentów i użytkowników. Między tymi dwoma grupami występują bazy danych, których struktura często jest utrzymana przez producentów, ale ich zawartość jest uwarunkowana potrzebami użytkowników. Bazy danych są przeważnie finansowane przez rząd i dostępne dla społeczeństwa przez typową przeglądarkę. Bogatsze instytucje często kopiują publiczne bazy danych w komputerze sieci lokalnej, by powiększyć dostęp dla swoich lokalnych użytkowników.
Producenci Bioinformatyczni Grupy naukowców i przedstawiciele rządowi, którzy produkują publicznie dostępne programy i bazy danych. Przykładami są liczne programy i bazy danych utrzymane przez NCBI, włączając w to GenBank Genomowe i farmaceutyczno-genomowe przedsiębiorstwa, które oferują bazy danych i usługi zewnętrznym nabywcom, jak również dla własnego wewnętrznego użytku. Do tej grupy zaliczamy przedsiębiorstwa, jak Incyte, Celera, CuraGen i GeneLogic Duże farmaceutyczne, biotechnologiczne i agrobiotechnologiczne przedsiębiorstwa, które rozwijają własne, wewnętrzne bazy danych, poszerzając przy tym bioinformatyczną wiedzę specjalistyczną
Użytkownicy Bioinformatyczni 1 Przedsiębiorstwa farmaceutyczne i biotechnologiczne używają bioinformatycznej technologii na wszystkich etapach procesu odkrywania leków, począwszy od identyfikacji celu przez zalegalizowanie, optymalizację, opisanie skuteczności leku i kliniczną diagnostykę Przedsiębiorstwa farmaceutyczne, które istotnie zaangażowały się w badaniach genomu rozwinęły już konkretną infrastrukturę bioinformatyczną (SmithKline, Glaxo, Merck, Novartis i inne)
Użytkownicy Bioinformatyczni 2 Agrobiotechnologia / Przemysłowe przedsiębiorstwa biotechnologiczne. Przyśpieszone tempo sekwencjonowania genomów termofilnych organizmów i innych organizmów żyjących w ekstremalnych warunkach (extremofili, jak M. thermoautotrophicus w Genome Therapeutics) może dostarczyć nowych źródeł enzymów dla procesów przemysłowych Ze względu na negatywny stosunek społeczeństwa w do organizmów genetycznie modyfikowanych (ang. genetically modified organisms - GMO) ten obszar rynku bioinformatycznego będzie się rozwijał wolniej niż rynek biofarmaceutyczny
Użytkownicy Bioinformatyczni 3 Grupy badawcze, szczególnie uczestniczące w badaniach międzynarodowych dotyczących sekwencjonowania ludzkiego genomu, torują drogę większości genomowym i bioinformatycznym technikom do codziennego użycia. W rezultacie, badawcze bioinformatyczne potrzeby naukowców często zaspokajane są przez publicznie dostępne programy "pulpitowe" (jak te od InforMax albo GCG) oraz systemy domowe Inne rynki, zapowiadane powiększenie użycia genetycznych baz danych do użytku wewnętrznego agencji takich jak np. FBI i innych uzbrojonych służb
BISTI Kilka lat temu Narodowy Instytut Zdrowia stworzył BISTI, czyli Inicjatywę Biomedycznej Informacji i Technologii, po to aby kontrolować rozwój bioinformatyki w USA. Praca BISTI opierała się na biomedycznych badaniach, których celem miał być rozwój przemysłu farmaceutycznego. Wówczas bioinformatyka była nową, z którą wiązano olbrzymie nadzieje i uważano, że tkwi w niej ogromny potencjał.
CADD (Computer Aided Drug Design) Wspomaganie Komputerowe Projektowania Leków, nazywane w skrócie - CADD. System ten jest wykorzystywany między innymi przez BISTI Jest to specjalistyczna dziedzina, która wykorzystuje metody komputerowe w procesie symulacji interakcji między receptorem a lekiem CADD zależy w głównej mierze od zastosowanych narzędzi bioinformatycznych, aplikacji oraz wykorzystywanych baz danych
Obszary wspierania CADD przez bioinformatykę: Wirtualne Obrazowanie (vhts) Jedną z najważniejszych metod stosowanych w wirtualnym obrazowaniu jest vhts. W metodzie tej wykorzystuje się białka dostępne w bazach danych struktur molekularnych, w celu ustalenia drogą doświadczalną, która z molekuł silniej zwiąże się z potencjalnym celem leku, czyli która okaże się bardziej skuteczna.
Analiza sekwencji - polega na porównywaniu sekwencji z sekwencją modelową. Dzięki temu możliwe jest badanie powiązań ewolucyjnych organizmów, a także wyszukiwanie podobieństw między badaną sekwencją a sekwencjami zawartymi w bazach danych.
Modelowanie homologiczne - polega na determinowaniu struktury trzeciorzędowej białek. Ponieważ większość tzw. celów, czyli obszarów na które ma wpłynąć dany lek, zbudowane jest z białek, to znajomość struktury trzeciorzędowej ma ogromne znaczenie. Ciało człowieka zawiera od 500 tysięcy do miliona białek. Struktura trzeciorzędowa została poznana tylko w przypadku niewielkiej liczby z nich. Wykorzystuje się w tym przypadku takie narzędzia, jak MODELLER, oraz bazę SWISS-MODEL
Wyszukiwanie podobieństw - bardzo powszechna czynność stosowana przez firmy farmaceutyczne, wykorzystująca różnorodne narzędzia (podobieństwa dwuwymiarowe lub trójwymiarowe) Optymalizacja - jest to najdłuższy i najkosztowniejszy z etapów. Polega ona na modyfikacji struktury pierwszorzędowej i drugorzędowej takich związków. Może się ona odbywać np. przy pomocy programu WABE
Fizykochemiczne modelowanie - ukazuje interakcje pomiędzy lekiem a miejscem jego ataku. Obejmuje sposób wiązania się tych dwóch elementów, a także informuje o biofizycznych i biochemicznych cechach każdej z nich. Przeważnie odbywa się to z zastosowaniem bazy danych Swiss-PDB. Baza ta pozwala na przewidywanie właściwości fizykochemicznych, takich jak hydrofobowość i polarność, które wywierają wpływ na tworzenie się wiązań między wspomnianymi cząsteczkami.
Biodostępność i bioaktywność - wiele testowanych środków, jak się okazuje, nie przechodzi pozytywnie badań klinicznych (toksyczność oraz zaburzenia metabolizmu, jakie dany związek powoduje). Charakterystycznymi cechami takich związków są; absorpcja, dystrybucja, metabolizm, wydalanie, toksyczność. Wszystkie te cechy można określić dwoma terminami: biodostępność i bioaktywność. Przeważnie cechy te są sprawdzane w wyniku badań laboratoryjnych, jednakże istnieje możliwość sprawdzenia ich za pomocą programów bioinformatycznych.
Korzyści wynikających ze stosowania metody CADD Redukcja kosztów Wybór najlepszego z możliwych produktów Stosownie metod bioinformatycznych w tej dziedzinie pozwala odnaleźć możliwe interakcje Często, gdy naukowcy tworzą przy pomocy komputera związek, składający się z dwóch molekuł, który jest potencjalnym lekiem, okazuje się, że w momencie symulacji pojawiają się nowe koncepcje, dotyczące ulepszenia takiego specyfiku