Przybliżone algorytmy analizy ekspresji genów. Opracowanie i implementacja algorytmu analizy danych uzyskanych z eksperymentu biologicznego. 20.06.04 Seminarium - SKISR 1
Wstęp. Dane wejściowe dla programu stanowią rezultaty uzyskane w wyniku przeprowadzenia eksperymentu biologicznego z wykorzystaniem mikromacierzy firmy Affmatrix Zadaniem programu jest określenie ewentualnych związków pomiędzy poszczególnymi genami bądź ich grupami które uległy ekspresji podczas eksperymentu. 20.06.04 Seminarium - SKISR 2
Faza eksperymentu Kluczowym elementem tego etapu jest wykorzystanie mikromacierzy DNA (biochipu). Mikromacierz jest urządzeniem pozwalającym na określenie rodzaju genów ulegających ekspresji w danej chwili w badanej tkance, oraz stopnia ekspresji tych genów. 20.06.04 Seminarium - SKISR 3
Faza eksperymentu Ekspresja genu oznacza iż jest on w danej chwili tłumaczony na odpowiadającą mu sekwencje aminokwasów czyli białko. Ekspresja genu jest równoważna obecności w cytoplazmie komórek badanej tkanki, cząsteczek mrna których budowa odpowiada sekwencji zasad tworzących dany gen. Cząsteczki mrna stanowią jeden z podstawowych substratów procesu transkrypcji przepisywania sekwencji zasad CGAT na sekwencję aminokwasów (białko) Mikromacierz zbudowana jest z sond których podstawowym elementem są fragmenty crna (ang. Complementary RNA). 20.06.04 Seminarium - SKISR 4
Faza eksperymentu Podczas eksperymentu cząsteczki mrna występujące w cytoplazmie łączą się z komplementarnymi nićmi crna sond mikromacierzy. Każda sonda odpowiadająca danemu genowi sygnalizuje stopień jego ekspresji (na diagramach określony kolorem). 20.06.04 Seminarium - SKISR 5
Wynik eksperymentu w postaci diagramu ekspresji genów 20.06.04 Seminarium - SKISR 6
Dane dla programu Wyniki uzyskane z mikromacierzy przekłada się na zbiór x punktów w y- wymiarowej przestrzeni. y = liczba przeprowadzonych pomiarów (liczba próbek jakimi dysponujemy) x = stopień ekspresji danego genu 20.06.04 Seminarium - SKISR 7
Dane dla programu Otrzymujemy w ten sposób wielowymiarową przestrzeń z pewną liczbą rozmieszczonych w niej punktów. Zadaniem programu jest odszukanie w zdefiniowanej w ten sposób przestrzeni korelacji pomiędzy rozmieszczonymi w niej punktami. 20.06.04 Seminarium - SKISR 8
Założenia Geny o podobnych wzorcach ekspresji są funkcjonalnie podobne. Oznacza to iż znalezienie funkcjonalnie powiązanych ze sobą genów jest równoważne znalezieniu grupy genów (ang.cluster) skupionych w tym samym obszarze przestrzeni danych. 20.06.04 Seminarium - SKISR 9
Problemy Duża liczba wymiarów Konwencjonalne metody wyznaczania korelacji pomiędzy punktami okazują się nieskuteczne Wykorzystanie dobrze znanych algorytmów analizy wielowymiarowych danych, sprawdzonych w innych dziedzinach informatyki takich jak rozpoznawanie mowy, czy obrazów 20.06.04 Seminarium - SKISR 10
Algorytmy Algorytm samoorganizujących się map (Self Organizing Maps - SOM) z góry określona liczba poszukiwanych grup powiązanych genów K-means clustering bardzo podobny do SOM, lecz bez założeń co do liczby poszukiwanych klastrów. 20.06.04 Seminarium - SKISR 11
SOM Z założenia poszukujemy grup genów (czyli genów o podobnej funkcjonalności), Geny reprezentowane jako punkty w wielowymiarowej przestrzeni Wybór topologii wierzchołków (ang. centroids) krata [1], Centroidy są tego samego wymiaru co geny, Centroidy w kolejnych iteracjach przesuwają się w kierunku poszczególnego genu na podstawie funkcji, której wartość zależy od numeru iteracji i odległości od punktu danych, Im dalej od punktu danych tym mniejsze przesunięcie centroidy, Im wyższa iteracja tym mniejsze przesunięcie, Warunki stopu: Rozpatrzone zostały wszystkie punkty danych, Centroidy (wierzchołki) nie wykonują ruchu powyżej określonego progu 20.06.04 Seminarium - SKISR 12
SOM c.d. 20.06.04 Seminarium - SKISR 13
K means clustering Sposób działania algorytmu jest bardzo podobny do SOM, Wybieramy grupę wierzchołków (ich liczba może być dowolna), Centroidy możemy rozmieścić w dowolny (losowy) sposób w przestrzeni. Postępujemy tak jak w algorytmie SOM. 20.06.04 Seminarium - SKISR 14
Porównanie metod Jednym z etapów tworzonej pracy magisterskiej będzie porównanie otrzymanych na podstawie analizy ekspresji genów wyników przy zastosowaniu różnych metod. 20.06.04 Seminarium - SKISR 15
Dlaczego to jest takie ważne? Wiadomo, iż nowotwory czy inne dolegliwości powstają poprzez mutacje różnych genów, Odkrycie oraz opisanie tego zjawiska może spowodować wynalezienie lekarstwa na dany rodzaj dolegliwości. 20.06.04 Seminarium - SKISR 16
Bibliografia 1. Microarrays for an integrative genomics Isaac S. Kohane, Alvin T. Kho, Atul J. Butte 20.06.04 Seminarium - SKISR 17