Bioinformatyczna analiza danych Wykład 1 Dr Wioleta Drobik-Czwarno Katedra Genetyki i Ogólnej Hodowli Zwierząt
Sprawy organizacyjne Prowadzący przedmiot: Dr Wioleta Drobik-Czwarno koordynator przedmiotu, wykłady, ćwiczenia Pokój:35 (Katedra Genetyki i Ogólnej Hodowli Zwierząt) Telefon: 22 59 36582 Email: wioleta.drobik@gmail.com; wioleta_drobik@sggw.pl Konsultacje: wtorek 9-11 (lub inny termin po wcześniejszym umówieniu się) Dr Zuzanna Nowak 1 blok ćwiczeniowy ekspresja genów Pokój 28, email: zuzanna_nowak@sggw.pl Mgr inż. Marlena Wojciechowska 1 blok ćwiczeniowy mikromacierze SNP Pokój 29, email: marlena_wojciechowska@sggw.pl Mgr inż. Agnieszka Szostak 1 blok ćwiczeniowy ekspresja genów Pokój 29, email: agnieszka_szostak@sggw.pl
Sprawy organizacyjne Organizacja przedmiotu ECTS: 3 pkt 10 h wykładów 1 h wykładu w tygodniu 30 h ćwiczeń 3 h ćwiczeń w tygodniu Planowane zakończenie zajęć: druga połowa maja
Zasady zaliczenia przedmiotu Egzamin 40% Pytania z części wykładowej i ćwiczeniowej Pytania otwarte odpowiedź na kilka zdań, uzupełnianie, uszeregowanie Przykładowe pytania: Wymień znane ci rodzaje mikromacierzy W jakim celu wykonujemy analizę PCA przed GWAS? Wypisz etapy analizy bioinformatycznej mającej na celu wykrywanie polimorfizmów typu SNP na podstawie NGS.
Zasady zaliczenia części ćwiczeniowej Projekt ~ 40% oceny Prowadzący dostarcza: publikacje do opracowania, dane, zarys problemu badawczego Należy przygotować prezentację w której znajdą się: 1. Omówienie publikacji 2. Omówienie problemu badawczego 1. Wstęp 2. Materiał i metody 3. Wyniki 4. Podsumowanie i wnioski Czas na prezentację projektu: 15-20 minut Grupy od 2 do 4 osób, istnieje możliwość przygotowania projektu samodzielnie.
Zasady zaliczenia części ćwiczeniowej Praca na zajęciach ~ 20% oceny Jak wyżej, czyli zaangażowanie w ćwiczenia, wykonanie przewidzianych analiz oceniane na koniec ćwiczeń Po danym bloku tematycznym (co ~2 tygodnie) każdy ma obowiązek nadesłać pytanie drogą mailową Czas - do czwartku w następnym tygodniu zajęć Pytanie może dotyczyć wykładu lub ćwiczeń. Nie może być to pytanie, o coś na co odpowiedz była już podana. Pytamy o to czego nie zrozumieliśmy, co nas zaintrygowało, w stosunku do czego mamy wątpliwości.
Czym będziemy zajmowali się na zajęciach Analizy bioinformatyczne: analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza głównych składowych PCA, ang. Principal Component Analysis) analiza asocjacyjna w skali genomu (GWAS, and. Genome-Wide Association Studies) sekwencjonowanie nowej generacji (NGS, ang. Next Generation Sequencing) analiza ekspresji genów Podstawy obsługi command line w systemie linux Zastosowanie środowiska R w bioinformatyce
Mikromacierze DNA
Wybrane techniki wykrywania polimorfizmu DNA RFLP - polimorfizm długości fragmentów restrykcyjnych AFLP - polimorfizm długości amplifikowanych fragmentów SSCP - Polimorfizm konformacyjny jednoniciowych fragmentów RAPD - Polimorfizm losowo amplifikowanych fragmentów Polimorfizm sekwencji powtarzających się tandemowo Sekwencje mikrosatelitarne (STR) Sekwencje minisatelitarne (VNTR) Zmienność liczby kopii (CNV) Mikromacierze SNP Sekwencjonowanie
Mikromacierze DNA Działanie opiera się na hybrydyzacji jednoniciowych kwasów nukleinowych w struktury dwuniciowe Płytka zawiera sondy DNA o znanej sekwencji nukleotydowej Jedna płytka może zawierać setki tysięcy sond Badanie polega na naniesieniu materiału biologicznego na płytkę i odczytaniu sygnału
Mikromacierze DNA Główne typy mikromacierzy w zależności od rodzaju sond: Mikromacierze cdna Mikromacierze oligonukleotydowe Inne przykłady wykorzystania mikromacierzy w naukach biologicznych: Mikromacierze tkankowe (TMA) Porównawcza hybrydyzacja genomowa do mikromacierzy (acgh; ang. Agilent Comparative Genomic Hybridization) analiza struktury genomu
Etapy analizy 1. Opracowanie celu badawczego 2. Przygotowanie mikromacierzy (lub zakup komercyjnie dostępnego produktu) 3. Przygotowanie prób: izolacja materiału genetycznego, oczyszczanie, odwrotna transkrypcja (przy mrna), znakowanie, fragmentacja 4. Hybrydyzacja znakowanych sond na mikromacierzy 5. Detekcja i wizualizacja wyników 6. Analiza bioinformatyczna i interpretacja wyników
Mikromacierze cdna Rolę sond pełnią fragmenty cdna o długości 0,5 do 2,0 kbp będące produktami amplifikacji PCR Umożliwia porównanie ekspresji genów w próbie eksperymentalnej i kontrolnej poprzez wyznakowanie prób dwoma różnymi barwnikami Łatwiejsze do przygotowania niż mikromacierze oligonukleotydowe. Zwykle przygotowywane na potrzeby danego eksperymentu
Mikromacierze ekspresyjne Etapy analizy: 1. Izolacja RNA 2. Odwrotna transkrypcja - przepisanie RNA na komplementarny DNA (cdna) 3. Znakowanie - Dołączanie znakowanych nukleotydów do powstających cząsteczek cdna 4. Odczyt i interpretacja wyników natężenie fluorescencji jest proporcjonalna do ilości wyznakowanych cząsteczek 5. Analiza bioinformatyczna wyników Veronique Vermeeren and Luc Michiels (2011) Evolution towards the implementation of point-ofcare biosensors. ISBN 978-953-307-443-6
Mikromacierze oligonukleotydowe (chipy DNA, macierze genotypowe) Sondy: krótkie oligonukleotydy o długości 10-25 bp (są stosowane również długie sondy o długości 50 70 bp) Służą m.in. do badania ekspresji genów, wykrywania polimofizmów typu SNP Największe firmy biotechnologiczne zajmujące się produkcją chipów DNA dla ludzi i zwierząt: Affymetrix - statyczne chipy DNA, sondy syntetyzowane są bezpośrednio na płytce w technice fitolitografii Illumina - sondy zakotwiczone są na powierzchni silikonowych ziaren (ang. beads), każde ziarno to setki tysięcy kopii jednej sondy
Mikromacierze oligonukleotydowe 1. Izolacja DNA (lub RNA) z materiału biologicznego, powielenie DNA w procesie amplifikacji oraz fragmentacja 2. Wytrącanie DNA i zawieszenie w buforze do hybrydyzacji 3. Naniesienie na powierzchnię mikromacierzy; Hybrydyzacja jednoniciowych fragmentów DNA z sondami o komplementarnej sekwencji 4. Dobudowanie nukleotydu do sondy zgodnie z sekwencją badanej próby DNA oraz wybarwianie 5. Skanowanie; Odczyt i interpretacja wyników Źródło: Affymetrix
Zastosowanie mikromacierzy SNP Nauki o zwierzętach: Badania asocjacyjne prowadzone na całym genomie (GWAS) Selekcja genomowa Kontrola pochodzenia Genetyka populacyjna Medycyna: GWAS Diagnostyka chorób genetycznych i chorób zakaźnych Wykrywanie aberracji chromosomowych Identyfikacja genów np. odporności na antybiotyki
Programy do analizy surowych danych z mikromacierzy SNP Illumina Genome Studio demonstracja na ćwiczeniach Axiom Analysis Suite
Axiom Analysis Suite Umożliwia przeprowadzenie pełnej analizy w jednym programie Import plików Konfiguracja ustawień Ustawienia filtrów QC (ang. Quality Control) Domyślne ustawienia dla gatunków di- oraz poliploidalnych Wizualizacja wyników Np. Axiom CNV Summary Tool
A. Pliki.CEL Format.CEL przechowuje informację o poziomie intensywności fluorescencji każdej z sond mikromacierzowych B. Ustawienia analizy Przygotowanie plików do dalszych analiz Ustawienia projektu Wstępna kontrola jakości próbki C. Kontrola jakości Sample QC jakość płytki, procent próbek, które przechodzą kontrolę jakości SNP QC parametry jakości dotyczące markerów SNP
Wyniki Kodowanie genotypów (Call code): AB, 012, ACTG
Kontrola jakości SNP Cluster Graph Generowane dla każdego markera
Cluster Plot Oś Y: Size (lub strength) siła sygnału, liczona jako: [Log2(A_signal) + Log2(B_signal)]/2 Oś X: Contrast (lub log ratio) Główna informacja dla rozróżnienia genotypów, liczony jako: Log2(A_signal/B_signal)
Literatura Charon K., Świtoński M. 2012. Genetyka i Genomika Zwierząt. PWN. Wojciechowska M., Olech W. 2013. Wykorzystanie mikromacierzy DNA w badaniach dzikich zwierząt. Studia i Materiały CEPL w Rogowie. R. 15. Zeszyt 36 / 3 / 2013. Platforma Affymetrix: http://www.affymetrix.com/ Platforma Illumina: https://www.illumina.com/