Analiza zmienności czasowej danych mikromacierzowych



Podobne dokumenty
Dane mikromacierzowe. Mateusz Markowicz Marta Stańska

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

MIKROMACIERZE. dr inż. Aleksandra Świercz dr Agnieszka Żmieńko

Przybliżone algorytmy analizy ekspresji genów.

Analizy wielkoskalowe w badaniach chromatyny

Testowanie hipotez statystycznych

Bioinformatyka, edycja 2016/2017, laboratorium

Kombinatoryczna analiza widm 2D-NOESY w spektroskopii Magnetycznego Rezonansu Jądrowego cząsteczek RNA. Marta Szachniuk

Przykładowa analiza danych

Oznaczenie polimorfizmu genetycznego cytochromu CYP2D6: wykrywanie liczby kopii genu

Oznaczenie polimorfizmu genetycznego cytochromu CYP2D6: wykrywanie liczby kopii genu

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

"Zapisane w genach, czyli Python a tajemnice naszego genomu."

Leki chemiczne a leki biologiczne

METODY STATYSTYCZNE W BIOLOGII

Bioinformatyczna analiza danych. Wykład 1 Dr Wioleta Drobik-Czwarno Katedra Genetyki i Ogólnej Hodowli Zwierząt

METODY STATYSTYCZNE W BIOLOGII

O której to się wraca do domu?! Czy można mówić o rewolucji analitycznej w energetyce?

Specjalność (studia II stopnia) Oczyszczanie i analiza produktów biotechnologicznych

GENOMIKA FUNKCJONALNA. Jak działają geny i genomy? Poziom I: Analizy transkryptomu

ROZPRAWA HABILITACYJNA

Metody inżynierii genetycznej SYLABUS A. Informacje ogólne

FORMY KONTROLI OSIĄGNIĘĆ UCZNIÓW W ŚWIETLE REFORMY EDUKACJI. Lublin. sprawdziany mają zadania głównie badające wiadomości.

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Wprowadzenie do statystyki dla. chemików testowanie hipotez

Żródło:

Analiza genetyczna w niepowodzeniach ciąży i badaniach prenatalnych

LEKI CHEMICZNE A LEKI BIOLOGICZNE

Katedra Zarządzania i Informatyki Politechnika Śląska

SCENARIUSZ ZAJĘĆ SZKOLNEGO KOŁA NAUKOWEGO Z PRZEDMIOTU BIOLOGIA PROWADZONEGO W RAMACH PROJEKTU AKADEMIA UCZNIOWSKA

NIPT Nieinwazyjny Test Prenatalny (ang. Non-Invasive Prenatal Test)

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

ROZPRAWA DOKTORSKA STRESZCZENIE

Konferencja Wspólnie na rzecz ochrony powietrza i zdrowia. Aleksander Sobolewski

Biologia medyczna, materiały dla studentów

STATYSTYKA MATEMATYCZNA WYKŁAD 5 TEST T

Projektowanie reakcji multiplex- PCR

Metody: PCR, MLPA, Sekwencjonowanie, PCR-RLFP, PCR-Multiplex, PCR-ASO

Pierwsze badanie dla nowego leku przeprowadził (chociaż incydentalnie) chirurg Ambroise Pare w 1537.

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

Żródło:

Niepełnosprawność intelektualna

Załącznik nr 1A do siwz Część I - Zestaw testowy do szybkiej identyfikacji Escherichia coli

rozpoznawania odcisków palców

Faramkoekonomiczna ocena leków biopodobnych. dr Michał Seweryn

W poszukiwaniu sensu w świecie widzialnym

Diagnostyka molekularna w OIT

STATYSTYKA MATEMATYCZNA

CZĘŚĆ III OPISPRZEDMIOTU ZAMÓWIENIA (OPZ)

Temat: Patentowanie genów analiza obecnych regulacji prawnych oraz alternatywnych rozwiązań w świetle teorii filozoficzno-prawnych prawa patentowego

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Dr. habil. Anna Salek International Bio-Consulting 1 Germany

Analiza i monitoring środowiska

STATYSTYKA MATEMATYCZNA

TEMAT: Pozytywny wynik testu diagnostycznego czy zawsze wyrok?

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

S YL AB US MODUŁ U ( PRZEDMIOTU) I nforma c j e ogólne

Warunki udzielania świadczeń w rodzaju: świadczenia zdrowotne kontraktowane odrębnie 8. BADANIA GENETYCZNE

Kontekstowe modele efektywności nauczania po I etapie edukacyjnym

Instytut Mikrobiologii

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

PODSTAWY BIOINFORMATYKI

Pomiar gotowości szkolnej uczniów za pomocą skali quasi-obserwacyjnej

Dlaczego pomiar jest tak istotny?

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

PRZEWODNIK PO PRZEDMIOCIE

Laboratorium Wirusologiczne

Centrum Badań DNA - przykład start-up u w biotechnologii

Zapytanie ofertowe nr 3/2017 z dnia r.

Czas na nowe standardy pomiaru zużycia paliwa.

METODY STATYSTYCZNE W BIOLOGII

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Potrzeby instytutów badawczych w zakresie wsparcia procesu rozwoju nowych leków, terapii, urządzeń medycznych... OŚRODEK TRANSFERU TECHNOLOGII

1. KEGG 2. GO. 3. Klastry

Oświetlając drogę: Nowy biomarker choroby Huntingtona

Warszawa, dnia 3 sierpnia 2016 r. Poz. 1173

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

era genomowa w hodowli bydła mlecznego Instytut Zootechniki Państwowy Instytut Badawczy

Forum ezdrowia Sopot 2018

KOMPUTEROWE MEDIA DYDAKTYCZNE JAKO NARZĘDZIE PRACY NAUCZYCIELA FIZYKI SPRAWOZDANIE Z BADAŃ WŁASNYCH

, a ilość poziomów czynnika A., b ilość poziomów czynnika B. gdzie

NUTRIFIT. Dostosuj swoje życie do potrzeb własnego organizmu

Instytut Mikrobiologii

PRZEWODNIK PO PRZEDMIOCIE

Algorytmy Komunikacyjne dla Trójwymiarowych Sieci Opartych na Plastrze Miodu. Ireneusz Szcześniak. Politechnika Śląska 20 czerwca 2002 r.

Biotechnologia jest dyscypliną nauk technicznych, która wykorzystuje procesy biologiczne na skalę przemysłową. Inaczej są to wszelkie działania na

Najbardziej Wiarygodny, Nieinwazyjny Test Prenatalny wykonywany w Polsce Test NIFTY : tylko mała próbka krwi ciężarnej

Czy chore na raka piersi z mutacją BRCA powinny otrzymywać wstępną. Klinika Onkologii i Radioterapii

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Statystyka i Analiza Danych

Scenariusz lekcji biologii z wykorzystaniem metody CILIL Lekcja dla klasy IV technikum o rozszerzonym zakresie kształcenia

Walidacja metod analitycznych Raport z walidacji

Metody badania ekspresji genów

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Kamila Muraszkowska Znaczenie wąskich gardeł w sieciach białkowych. źródło: (3)

System wspomagania harmonogramowania przedsięwzięć budowlanych

WARSZAWSKI UNIWERSYTET MEDYCZNY

W OPARCIU JEDNOWIĄZKOWY SONDAŻ HYDROAKUSTYCZNY

Transkrypt:

Systemy Inteligencji Obliczeniowej Analiza zmienności czasowej danych mikromacierzowych Kornel Chromiński Instytut Informatyki Uniwersytet Śląski

Plan prezentacji Dane mikromacierzowe Cel badań Prezentacja metody Testy na zbiorach sztucznych Testy na zbiorach rzeczywistych Porównanie z przyjętymi metodami Podsumowanie

Ekspresja genów Proces, w którym informacja genetyczna zawarta w genie zostaje odczytana i przepisana na jego produkty, które są białkami lub różnymi formami RNA.

Mikromacierze oligonukleoidowe Mikromacierze DNA (chipy DNA) są zbiorem sond molekularnych Sondy molekularne to substancje chemiczne mające zdolność specyficznego wiązania się z określonym fragmentem DNA Obecnie mikromacierze mogą zawierać do kilkuset tysięcy sond

Mikromacierze Przy użyciu mikromacierzy poszukuję się odpowiedzi na pytania: Jak ekspresja genów różni się w różnych typach komórek. Jak zmienia się ekspresja genów pod wpływem czynników zewnętrznych (leki, substancje chemiczne). Jak różni się ekspresja genów pomiędzy tkankami zdrowymi i chorymi (np. komórki rakowe).

Analiza danych mikromacierzowych Skany mikromacierzy Wartości liczbowe Tabela ekspresji genów Analiza niskiego poziomu Analiza wysokiego poziomu

Analiza zmienności czasowej poziomu ekspresji genów Ma za zadania odpowiedzieć na pytanie jak zmienia się poziom ekspresji genów w czasie Wykonuje się ją w celu: Badania wpływu leków na poziom ekspresji. Badania wpływu środków chemicznych na poziom ekspresji genów. Badania zmian poziomu ekspresji genów w cyklu życiowym.

Cel badań Celem badań było zaproponowanie metody wykrywania zmian poziomu ekspresji genów w czasie. Założeniem było aby proponowane metoda cechowała się niższą czułością od obecnie używanych metod (wykrywała te geny, które rzeczywiście ulegają znacznej zmianie poziomu ekspresji). Metoda miała być również prosta i łatwa w stosowaniu.

Proponowane podejście Metoda oparta na wariancji w próbie Metoda składa się: Z dwóch etapów dla danych z próbą kontrolną i badaną Z jednego etapu dla danych tylko z próbą badaną W celu przeprowadzenia analizy stosuje się wzór: Var( X t ) 0,1 Var( X ) Gdzie: Var( X t ) Var(X ) - średnia wariancji mierzonej w poszczególnych punktach czasowych; - wariancja całkowita dla wszystkich mikromacierzy.

Testowanie skuteczności metody Przetestowanie na zbiorach sztucznych symulujących dane mikromacierzowe, o znanej liczbie wartości, które powinny być wykryte jako ulegające zmianom poziomu ekspresji w czasie. Przetestowanie na zbiorach rzeczywistych. Porównanie wyników otrzymanych na zbiorach rzeczywistych z wynikami otrzymanymi za pomocą metod uznanych.

Wyniki dla zbiorów sztucznych Metoda przetestowane na 4 zbiorach sztucznych Zbiory sztuczne wygenerowane w sposób pseudolosowy Pod względem wartości symulowały dane mikromacierzowe

Wyniki dla zbiorów sztucznych Zbiór Liczba wartości w zbiorze Liczba punktów czasowych Liczba zmienionych Liczba wykrytych Liczba wykrytych z wartościami zmienionymi Zbiór sztuczny 1 Zbiór sztuczny 2 Zbiór sztuczny 3 Zbiór sztuczny 4 500 5 20 20 20 1000 5 20 20 20 1500 6 30 30 30 2000 10 40 40 40

Zbiory rzeczywiste Dane pochodzące z rzeczywistych eksperymentów mikromacierzowych Dane pochodzą z ogólnodostępnej bazy eksperymentów mikromacierzowych ArrayExpress Wszystkie dane pochodzą z mikromacierzy Affymetrix HG-U133A zawierają po 22283 probsety

Zbiory rzeczywiste zbiór liczba próbek w zbiorze pochodzenie danych zbiór 1 16 Odczyt poziomu ekspresji genów z tkanki zdrowej i zarażonej Herpeswirusem, eksperyment mikromacierzowy wykonany po podaniu wirusa, po 4, 8 i 12 godzinach zbiór 2 15 Odczyty ekspresji genów pochodzące z tkanki płucnej, po podaniu Deksametazonu, eksperyment mikromacierzowy wykonany bezpośrednio po podaniu leku i po pięciu dniach od jego podania zbiór 3 13 Poziom ekspresji genów z tkanki nabłonkowej w trakcie jej rozwoju, eksperyment wykonany na początku rozwoju tkanki nabłonkowej, po 3, 5, 7 i 10 dniach

Wyniki dla zbiorów rzeczywistych Liczba wykrytych proponowaną metodą Liczba wykrytych metodą SAM Liczba wykrytych metodą LIMMA Wspólnie wykryte proponowana metoda - SAM Wspólnie wykryte proponowana metoda - LIMMA Zbiór 1 263 751 689 198 173 Zbiór 2 284 1054 872 243 214 Zbiór 3 627 6160 2356 570 453

Zbiór 1

Zbiór 2

Zbiór 3

Podsumowanie Proponowana metoda działa prawidłowo na zbiorach sztucznych Uzyskała wysoką zgodność z metodami porównawczymi Dzięki niższej czułości od metod powszechnie używanych pozwala unikać wyników fałszywie pozytywnych

Dziękuję za uwagę