Modelowanie interakcji helis transmembranowych

Podobne dokumenty
Przewidywanie struktury kanału białkowego z wykorzystaniem probabilistycznych gramatyk formalnych oraz modelu ciągłego przepływu jonów

Ocena jakości modeli strukturalnych białek w oparciu o podobieństwo strukturalne i semantyczny opis funkcji w ontologii GO

Model Poissona-Nernsta-Plancka w predykcji struktury kanałów białkowych

Optymalizacja optymalizacji

9. Praktyczna ocena jakości klasyfikacji

Stan dotychczasowy. OCENA KLASYFIKACJI w diagnostyce. Metody 6/10/2013. Weryfikacja. Testowanie skuteczności metody uczenia Weryfikacja prosta

WYKŁAD 6. Reguły decyzyjne

WYKŁAD 7. Testowanie jakości modeli klasyfikacyjnych metodyka i kryteria

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład II 2017/2018

Dobór parametrów algorytmu ewolucyjnego

Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek

Prof. Stanisław Jankowski

W poszukiwaniu sensu w świecie widzialnym

Indukowane Reguły Decyzyjne I. Wykład 8

Wprowadzenie do klasyfikacji

Algorytmy genetyczne jako metoda wyszukiwania wzorców. Seminarium Metod Inteligencji Obliczeniowej Warszawa 26 X 2005 mgr inż.

Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner

PROGRAM SEMINARIUM ZAKOPANE czwartek, 1 grudnia 2011 r. Sesja przedpołudniowa

Meta-uczenie co to jest?

POMIARY I MODELOWANIE

Projektowanie Nowych Chemoterapeutyków

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska

Data Mining Wykład 4. Plan wykładu

Algorytmy genetyczne w interpolacji wielomianowej

Bioinformatyka wykład 11, 11.I.2011 Białkowa bioinformatyka strukturalna c.d.

Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych

Optymalizacja systemów

2. Empiryczna wersja klasyfikatora bayesowskiego

Metody systemowe i decyzyjne w informatyce

Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji

Baza dla predykcji medycznej

Eksploracja danych OCENA KLASYFIKATORÓW. Wojciech Waloszek. Teresa Zawadzka.

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

Algorytmy klasyfikacji

Klasyfikacja i regresja Wstęp do środowiska Weka

Metody klasyfikacji danych - część 1 p.1/24

METODY INŻYNIERII WIEDZY

PRZYRÓWNANIE SEKWENCJI

Kombinacja jądrowych estymatorów gęstości w klasyfikacji wstępne wyniki

Porównanie modeli regresji. klasycznymi modelami regresji liniowej i logistycznej

Politechnika Wrocławska, Katedra Inżynierii Biomedycznej Systemy Pomiarowo-Diagnostyczne, laboratorium

Ćwiczenie 6 - Hurtownie danych i metody eksploracje danych. Regresja logistyczna i jej zastosowanie

SZTUCZNA INTELIGENCJA

prof. dr hab. Krzysztof Lewiński Kraków, Wydział Chemii Uniwersytetu Jagiellońskiego

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

Automatyczna predykcja. Materiały/konsultacje. Co to jest uczenie maszynowe? Przykład 6/10/2013. Google Prediction API, maj 2010



SPOTKANIE 2: Wprowadzenie cz. I

Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

LABORATORIUM 7: Problem komiwojażera (TSP) cz. 2

Systemy uczące się Lab 4

LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów

Klasyfikacja LDA + walidacja

Od e-materiałów do e-tutorów

AFM. Mikroskopia sił atomowych

Monitorowanie sytuacji drogowej w oparciu o dane z sieci GSM. promotor: dr hab. inż. Andrzej Jaszkiewicz

mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.

WSTĘP I TAKSONOMIA METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

Komputerowe wspomaganie projektowanie leków

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

WPŁYW SZYBKOŚCI STYGNIĘCIA NA WŁASNOŚCI TERMOFIZYCZNE STALIWA W STANIE STAŁYM

METODY INŻYNIERII WIEDZY

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Wykład 5 Dopasowywanie lokalne

Rozpoznawanie obrazów

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Testowy dokument raz dwa trzy

Jakość uczenia i generalizacja

Pattern Classification

WYKŁAD 2. Problem regresji - modele liniowe

Metody systemowe i decyzyjne w informatyce

2.2.P.07: Komputerowe narzędzia inżynierii powierzchni

DRZEWA REGRESYJNE I LASY LOSOWE JAKO

ZeroR. Odpowiada zawsze tak samo Decyzja to klasa większościowa ze zbioru uczącego A B X 1 5 T 1 7 T 1 5 T 1 5 F 2 7 F

Obliczenia inspirowane Naturą

Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2

Egzamin / zaliczenie na ocenę*

Planowanie ruchu brył i robotów

10/15/2016. Reguła. Czułość PV(+) Bayesa. Swoistość PV(-)

Tomasz Niedzielski a,b, Wiesław Kosek a

Tomasz Pawlak. Zastosowania Metod Inteligencji Obliczeniowej

Finanse behawioralne; badanie skłonności poznawczych inwestorów

Wykładnicze grafy przypadkowe: teoria i przykłady zastosowań do analizy rzeczywistych sieci złożonych

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne)

Monitorowanie i Diagnostyka w Systemach Sterowania na studiach II stopnia specjalności: Systemy Sterowania i Podejmowania Decyzji

Inspiracje kognitywne w procesie analizy pozycji szachowej

METODY INŻYNIERII WIEDZY

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

QSAR i związki z innymi metodami. Karol Kamel Uniwersytet Warszawski

PROJEKT Z BAZ DANYCH

Próba formalizacji doboru parametrów generalizacji miejscowości dla opracowań w skalach przeglądowych

Instrukcja do Gry Fold it

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Pearson Online English. Pełne zanurzenie w języku angielskim

Testowanie modeli predykcyjnych

Matlab podstawy + testowanie dokładności modeli inteligencji obliczeniowej

Transkrypt:

Modelowanie interakcji helis transmembranowych Witold Dyrka, Jean-Christophe Nebel, Małgorzata Kotulska Instytut Inżynierii Biomedycznej i Pomiarowej, Politechnika Wrocławska Faculty of Computing, Information Systems and Mathematics, Kingston University, Londyn Biochemikon. Wrocław, 23.04.2010

Cel projektu Przewidywanie konformacji przestrzennej interakcji helisa-helisa w białkach transmembranowych na podstawie sekwencji aminokwasowej w oparciu o model gramatyczny 2

Interakcje helisa-helisa w białkach transmembranowych Typy konformacji 2/3 interfejsów helisa-helisa można pogrupować w 4 zbiory o charakterystycznej konformacji przestrzennej (Walters&DeGrado'06) podział na podstawie RMSD pomiędzy fragmentami helis w kontakcie 3 Walters RFS, DeGrado WF. PNAS 103( 37): 13658 13663 (2006)

Zbiory danych uczących i testowych uczenie: po 20 fragmentów par helis z PDBTM najlepiej dopasowanych do wzorca typu walidacja: oryginalny zbiór Waltersa i DeGrado z 2006 r. niehomologiczny (<40%) ze zbiorem uczącym c1 92, c2 49, c3 37, c4 27 par test: wszystkie pary helis z nieredundantnego PDBTM w kontakcie typu c1-c4 27% 17% 29% 16% 9% 13% 33% Walters DeGrado (2006) 9% 11% 36% PDBTM (2009.11) c1 c2 c3 c4 other 4

Interakcje helisa-helisa model gramatyczny (1) Start Outer-face Outer-face OutsideResidues1 Interface OutsideResidues2 ε Interface InsideResidues1 Outer-face InsideResidues2 ε na podstawie: Waldispuehl J, Steyaert J-M. TCS 335: 67-92 (2005) Start Outer-face OutRes Interface OutRes InRes Outer-face InRes OutRes Interface OutRes InRes Outer-face InRes ε 5

Interakcje helisa-helisa model gramatyczny (2) Start Outer-face Outer-face OutsideResidues1 Interface OutsideResidues2 ε Interface InsideResidues1 Outer-face InsideResidues2 ε OutsideResidues1,OutsideResidues2, InsideResidues1,InsideResidues2 - reprezentują po 1 lub 2 aminokwasy Każdemu aminokwasowi przypisany poziom cechy fizykochemicznej, np. hydrofobowość, rozmiar itp. Reguła gramatyczna dla każdej kombinacji - ilości aminokwasów (1 lub 2) - poziomu cechy (Low, Medium, High) np. Interface Low Medium Outer-face Medium Low Interface Medium Outer-face Low High 6

Interakcje helisa-helisa model gramatyczny (3) 1. Interface Low Medium Outer-face Medium Low, Pr: 0.10 2. Interface Medium Outer-face Low High, Pr: 0.20 Każdej regule przypisane jest prawdopodobieństwo jej użycia, np. wychodząc od symbolu Interface: - regułę 1 użyjemy z prawdopodobieństwem 0.10, - regułę 2 użyjemy z prawdopodobieństwem 0.20. Uczenie - dobór optymalnego zestawu prawdopodobieństw dla zadanego zbioru uczącego algorytm genetyczny 7

Zadanie Klasyfikacja rozróżnienie do którego z 4 klastrów należy zadany kontakt helisa-helisa na podstawie zwracanej przez parser liczby opisującej dopasowanie analizowanej sekwencji do gramatyki 8

Walidacja: wyniki klasyfikacji fragmentów kontaktowych par helis(1) Trained for Using property Tested against AUC ROC Sensitivity Specificity Accuracy c1 accessibility c2 0.60 0.78 0.43 0.66 c2 c3 van der Waals volume van der Waals volume c3 0.60 0.47 0.70 0.53 c4 0.54 0.77 0.41 0.69 c2+c3+c4 0.59 0.76 0.42 0.57 c1 0.68 0.73 0.62 0.66 c3 0.54 0.76 0.46 0.63 c4 0.71 0.55 0.78 0.63 c1+c3+c4 0.65 0.73 0.57 0.61 c1 0.67 0.51 0.80 0.72 c2 0.52 0.43 0.78 0.63 c4 0.69 0.49 0.85 0.64 c1+c2+c4 0.63 0.49 0.79 0.74 c4 accessibility c1 0.43 0.44 0.54 0.52 c2 0.54 0.81 0.39 0.54 c3 0.60 0.48 0.73 0.62 c1+c2+c3 0.50 0.44 0.60 0.58 9

Walidacja: wyniki klasyfikacji fragmentów kontaktowych par helis(2) Trained for Using property Tested against AUC ROC Sensitivity Specificity Accuracy c1 accessibility c2 0.60 0.78 0.43 0.66 c2 c3 van der Waals volume van der Waals volume c3 0.60 0.47 0.70 0.53 c4 0.54 0.77 0.41 0.69 c2+c3 0.60 0.76 0.42 0.60 c1 0.68 0.73 0.62 0.66 c3 0.54 0.76 0.46 0.63 c4 0.71 0.55 0.78 0.63 c1+c4 0.69 0.73 0.61 0.64 c1 0.67 0.51 0.80 0.72 c2 0.52 0.43 0.78 0.63 c4 0.69 0.49 0.85 0.64 c1+c4 0.67 0.49 0.85 0.76 c4 accessibility c1 0.43 0.44 0.54 0.52 c2 0.54 0.81 0.39 0.54 c3 0.60 0.48 0.73 0.62 c2+c3 0.57 0.48 0.64 0.60 10

Walidacja: krzywe ROC klasyfikatorów - fragmenty kontaktowe par helis Sensitivity Sensitivity 1 0.8 0.6 0.4 0.2 0 1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 Specificity c1 c3 Sensitivity c2 Sensitivity c4 1 0.8 0.6 0.4 0.2 0 1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 Specificity 0 0 0.2 0.4 0.6 0.8 1 Specificity 0 Specificity 0 0.2 0.4 0.6 0.8 1 11

Test: wyniki anotacji par helis pozycja kontaktu nieznana Test AUC ROC Sensitivity Specificity Accuracy c1 vs c2+c3 accessibility c2 vs c1+c4 vdw volume 0.62 0.50 0.72 0.61 0.62 0.67 0.52 0.57 1 1 c1 Sensitivity 0.8 0.6 0.4 0.2 0 0 0.2 0.4 0.6 0.8 1 c2 Sensitivity 0.8 0.6 0.4 0.2 0 0 0.2 0.4 0.6 0.8 1 Specificity Specificity 12

Podsumowanie Pierwsza metoda przewidująca konformację interakcji helisa-helisa reprezentująca zależności pomiędzy dwoma elementami pary Skuteczność klasyfikacji została sprawdzona na niezależnym zbiorze danych pole pod krzywą klasyfikatora (AUC): 0.57-0.69 Zastosowania: punkt startowy modelowania struktury lokalnej ograniczenie przestrzeni poszukiwań metod globalnej predykcji ab initio 13

Dziękuję za uwagę Praca wspierana przez granty: MNiSW N N519 401537, UE(POKL)/UMarsz. Dolnego Śląska GRANT II/37/2009, Politechniki Wrocławskiej, British Council Young Scientists Programme WAR/342/108. 14