Systemy Inteligencji Obliczeniowej Analiza zmienności czasowej danych mikromacierzowych Kornel Chromiński Instytut Informatyki Uniwersytet Śląski
Plan prezentacji Dane mikromacierzowe Cel badań Prezentacja metody Testy na zbiorach sztucznych Testy na zbiorach rzeczywistych Porównanie z przyjętymi metodami Podsumowanie
Ekspresja genów Proces, w którym informacja genetyczna zawarta w genie zostaje odczytana i przepisana na jego produkty, które są białkami lub różnymi formami RNA.
Mikromacierze oligonukleoidowe Mikromacierze DNA (chipy DNA) są zbiorem sond molekularnych Sondy molekularne to substancje chemiczne mające zdolność specyficznego wiązania się z określonym fragmentem DNA Obecnie mikromacierze mogą zawierać do kilkuset tysięcy sond
Mikromacierze Przy użyciu mikromacierzy poszukuję się odpowiedzi na pytania: Jak ekspresja genów różni się w różnych typach komórek. Jak zmienia się ekspresja genów pod wpływem czynników zewnętrznych (leki, substancje chemiczne). Jak różni się ekspresja genów pomiędzy tkankami zdrowymi i chorymi (np. komórki rakowe).
Analiza danych mikromacierzowych Skany mikromacierzy Wartości liczbowe Tabela ekspresji genów Analiza niskiego poziomu Analiza wysokiego poziomu
Analiza zmienności czasowej poziomu ekspresji genów Ma za zadania odpowiedzieć na pytanie jak zmienia się poziom ekspresji genów w czasie Wykonuje się ją w celu: Badania wpływu leków na poziom ekspresji. Badania wpływu środków chemicznych na poziom ekspresji genów. Badania zmian poziomu ekspresji genów w cyklu życiowym.
Cel badań Celem badań było zaproponowanie metody wykrywania zmian poziomu ekspresji genów w czasie. Założeniem było aby proponowane metoda cechowała się niższą czułością od obecnie używanych metod (wykrywała te geny, które rzeczywiście ulegają znacznej zmianie poziomu ekspresji). Metoda miała być również prosta i łatwa w stosowaniu.
Proponowane podejście Metoda oparta na wariancji w próbie Metoda składa się: Z dwóch etapów dla danych z próbą kontrolną i badaną Z jednego etapu dla danych tylko z próbą badaną W celu przeprowadzenia analizy stosuje się wzór: Var( X t ) 0,1 Var( X ) Gdzie: Var( X t ) Var(X ) - średnia wariancji mierzonej w poszczególnych punktach czasowych; - wariancja całkowita dla wszystkich mikromacierzy.
Testowanie skuteczności metody Przetestowanie na zbiorach sztucznych symulujących dane mikromacierzowe, o znanej liczbie wartości, które powinny być wykryte jako ulegające zmianom poziomu ekspresji w czasie. Przetestowanie na zbiorach rzeczywistych. Porównanie wyników otrzymanych na zbiorach rzeczywistych z wynikami otrzymanymi za pomocą metod uznanych.
Wyniki dla zbiorów sztucznych Metoda przetestowane na 4 zbiorach sztucznych Zbiory sztuczne wygenerowane w sposób pseudolosowy Pod względem wartości symulowały dane mikromacierzowe
Wyniki dla zbiorów sztucznych Zbiór Liczba wartości w zbiorze Liczba punktów czasowych Liczba zmienionych Liczba wykrytych Liczba wykrytych z wartościami zmienionymi Zbiór sztuczny 1 Zbiór sztuczny 2 Zbiór sztuczny 3 Zbiór sztuczny 4 500 5 20 20 20 1000 5 20 20 20 1500 6 30 30 30 2000 10 40 40 40
Zbiory rzeczywiste Dane pochodzące z rzeczywistych eksperymentów mikromacierzowych Dane pochodzą z ogólnodostępnej bazy eksperymentów mikromacierzowych ArrayExpress Wszystkie dane pochodzą z mikromacierzy Affymetrix HG-U133A zawierają po 22283 probsety
Zbiory rzeczywiste zbiór liczba próbek w zbiorze pochodzenie danych zbiór 1 16 Odczyt poziomu ekspresji genów z tkanki zdrowej i zarażonej Herpeswirusem, eksperyment mikromacierzowy wykonany po podaniu wirusa, po 4, 8 i 12 godzinach zbiór 2 15 Odczyty ekspresji genów pochodzące z tkanki płucnej, po podaniu Deksametazonu, eksperyment mikromacierzowy wykonany bezpośrednio po podaniu leku i po pięciu dniach od jego podania zbiór 3 13 Poziom ekspresji genów z tkanki nabłonkowej w trakcie jej rozwoju, eksperyment wykonany na początku rozwoju tkanki nabłonkowej, po 3, 5, 7 i 10 dniach
Wyniki dla zbiorów rzeczywistych Liczba wykrytych proponowaną metodą Liczba wykrytych metodą SAM Liczba wykrytych metodą LIMMA Wspólnie wykryte proponowana metoda - SAM Wspólnie wykryte proponowana metoda - LIMMA Zbiór 1 263 751 689 198 173 Zbiór 2 284 1054 872 243 214 Zbiór 3 627 6160 2356 570 453
Zbiór 1
Zbiór 2
Zbiór 3
Podsumowanie Proponowana metoda działa prawidłowo na zbiorach sztucznych Uzyskała wysoką zgodność z metodami porównawczymi Dzięki niższej czułości od metod powszechnie używanych pozwala unikać wyników fałszywie pozytywnych
Dziękuję za uwagę