Ćwiczenia nr 4. Programy komputerowe stosowane do analizy danych molekularnych



Podobne dokumenty
ZARZĄDZANIE POPULACJAMI ZWIERZĄT

GENETYKA POPULACJI. Ćwiczenia 1 Biologia I MGR /

ZARZĄDZANIE POPULACJAMI ZWIERZĄT 1. RÓWNOWAGA GENETYCZNA POPULACJI. Prowadzący: dr Wioleta Drobik Katedra Genetyki i Ogólnej Hodowli Zwierząt

EGZAMIN MAGISTERSKI, Biomatematyka

Mitochondrialna Ewa;

WSTĘP. Copyright 2011, Joanna Szyda

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Rycina 1. Zasięg i zagęszczenie łosi (liczba osobników/1000 ha) w Polsce w roku 2010 oraz rozmieszczenie 29 analizowanych populacji łosi.

Laboratorium - Monitorowanie i zarządzanie zasobami systemu Windows XP

Laboratorium - Archiwizacja i odzyskiwanie danych w Windows Vista

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.

Bliskie Spotkanie z Biologią. Genetyka populacji

Ekologia molekularna. wykład 3

TABELE WIELODZIELCZE

Laboratorium - Monitorowanie i zarządzanie zasobami systemu Windows Vista

Podstawowe czynnos ci w programie PowerPoint

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Podstawowa charakterystyka statystyczna

Laboratorium - Użycie narzędzia Przywracanie systemu w systemie Windows 7

Modelowanie obiektowe - Ćw. 1.

Teoria ewolucji. Podstawy wspólne pochodzenie.

Zastępstwa Optivum. Jak rozpocząć pracę z programem Zastępstwa Optivum w nowym roku szkolnym? Przewodnik. Zakładanie nowej księgi zastępstw

Ekologia molekularna. wykład 4

Laboratorium - Narzędzia linii uruchamiania w systemie Windows 7

Laboratorium - Użycie narzędzia Przywracanie systemu w Windows Vista

Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski

Rozdział 5. Administracja kontami użytkowników

PORÓWNYWANIE POPULACJI POD WZGLĘDEM STRUKTURY

Laboratorium - Monitorowanie i zarządzanie zasobami systemu Windows 7

SYSTEMY OPERACYJNE I SIECI KOMPUTEROWE

Państwowa Wyższa Szkoła Zawodowa w Gorzowie Wlkp. Laboratorium architektury komputerów

INSTRUKCJA UŻYTKOWNIKA PORTALU SIDGG

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Anna Szewczyk. Wydział Geodezji Górniczej i InŜynierii środowiska AGH

Aplikacje WWW - laboratorium

Teoria ewolucji. Podstawowe pojęcia. Wspólne pochodzenie.

Jak utworzyć plik SIO dla aktualnego spisu?

Bioinformatyka Laboratorium, 30h. Michał Bereta

Pobieranie edytora CodeLite

Instrukcja użytkownika systemu S4

TURNINGPOINT KROKI DO URUCHOMIENIA TESTU NA PC

Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego

Testowanie hipotez statystycznych

Przywracanie systemu

PDF created with FinePrint pdffactory Pro trial version

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

1 Opis interfejsu użytkownika

Dopasowywanie czasu dla poszczególnych zasobów

TwinCAT 3 konfiguracja i uruchomienie programu w języku ST lokalnie

Celem ćwiczenia jest zapoznanie się z podstawowymi funkcjami i pojęciami związanymi ze środowiskiem AutoCAD 2012 w polskiej wersji językowej.

Testowanie hipotez statystycznych

Tomography Tracking Instrukcja użytkownika

Podstawy biologii. Informacja genetyczna. Co to jest ewolucja.

Temat: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

GENETYKA POPULACJI. Ćwiczenia 3 Biologia I MGR

Jak przesłać mapę do urządzenia lub na kartę pamięci?

Instrukcja wyłączenia cookies w przeglądarce

Lekcja 1: Origin GUI GUI to Graficzny interfejs użytkownika (ang. GraphicalUserInterface) często nazywany też środowiskiem graficznym

Instalacja i opis podstawowych funkcji programu Dev-C++

Bioinformatyka Laboratorium, 30h. Michał Bereta

GRAFIKA INŻYNIERSKA POLITECHNIKA ŚLĄSKA WYDZIAŁ ELEKTRYCZNY KATEDRA MECHATRONIKI. Instrukcja do ćwiczenia laboratoryjnego.

Sky-Shop.pl. Poradnik. Pierwsze kroki: Importowanie własnego pliku XML Integracje z hurtowniami

Aplikacja projektu Program wycinki drzew i krzewów dla RZGW we Wrocławiu

Obserwacje w Agrinavia MOBILE OGÓLNE INFORMACJE

OPROGRAMOWANIE DEFSIM2

Jedno okienkowy GIMP.

Jak wyłączyć pliki cookie w przeglądarce internetowej?

Ćwiczenie 3: Praca z tabelami

Jak zmienić ustawienia cookies?

Synchronizator plików (SSC) - dokumentacja

Kadry Optivum, Płace Optivum

KGGiBM GRAFIKA INŻYNIERSKA Rok III, sem. VI, sem IV SN WILiŚ Rok akademicki 2011/2012. Przygotowanie do druku

Aktualizacje oprogramowania Instrukcja obsługi

Laboratorium - Archiwizacja i odzyskiwanie danych w Windows 7

Rozdział 4: PIERWSZE KROKI

Ćwiczenie 216 Kontrola wymiarów podzespołu z pliku parametrów. Podłoga windy. a) b) c) rys

Laboratorium : Tworzenie partycji w Windows XP Pro

System Zdalnej Obsługi Certyfikatów Instrukcja użytkownika

Krótka instrukcja instalacji Adobe Acrobat Reader

Rejestrator radiowy temperatury Arexx TL-500

Niestandardowa tabela częstości

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Rozdział 7 ZARZĄDZANIE PROJEKTAMI

Migracja danych z plików XML do programu e ee Zoz

Laboratorium - Harmonogramowanie zadania przy użyciu GUI i polecenia AT w systemie Windows 7

Filogenetyka molekularna I. Krzysztof Spalik

INSTRUKCJA AKTUALIZACJI PRZEGLĄDARKI. Wersja dokumentu 1.0

5. Administracja kontami uŝytkowników

5.6.2 Laboratorium: Punkty przywracania

Kopiowanie, przenoszenie plików i folderów

Wprowadzenie do genetyki medycznej i sądowej

Temat: Organizacja skoroszytów i arkuszy

WOPZ Wieloaspektowa Ocena Preferencji Zawodowych instrukcja dla doradcy

Program OBRAZY-SŁOWA-DŹWIĘKI - wspomaganie rozwoju, terapii, komunikowania się. Spis treści

Aktyn - W Finanse - Księgowość Faktury VAT JPK_VAT(2)_v1-0

Podręcznik użytkownika Systemu Extranet

Dryf genetyczny i jego wpływ na rozkłady próbek z populacji - modele matematyczne. Adam Bobrowski, IM PAN Katowice

Podręczna pomoc Microsoft Power Point 2007

Laboratorium - Użycie narzędzia Przywracanie systemu w systemie Windows XP

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności.

Transkrypt:

Techniki molekularne ćw. 4 1 z 6 Ćwiczenia nr 4. Programy komputerowe stosowane do analizy danych molekularnych Istnieje ogromna liczba programów służących do analizy danych molekularnych. Wiele z nich zostało napisanych tylko dla jednej, konkretnej metody i dlatego znajdują zastosowanie jedynie w wyspecjalizowanych analizach. Jednak nawet liczba programów oferujących wiele metod jest znaczna i cały czas pojawiają się nowe, co stanowi źródło zamieszania i wielu frustracji. Poniżej przedstawiono dwa programy, które ze względu na łatwość użycia i szeroki wachlarz oferowanych metod uznaliśmy za najbardziej przydatne i najbardziej reprezentatywne (stan: listopad 2011 r.). I. Arlequin analiza allelicznych danych populacyjnych Arlequin pozwala na analizy genetyczno-populacyjne wszelkich typów danych molekularnych: allozymów, mikrosatelitów, polimorfizmów pojedynczych nukleotydów (SNP), markerów dominujących RAPD i AFLP, wzorców cięcia enzymami restrykcyjnymi (RFLP) oraz sekwencji DNA. W przygotowanym pliku znajdują się dane o genotypach 4 genów MHC II w 7 populacjach traszki górskiej z Polski. Za pomocą programu Arlequin obliczymy wartości F ST dla każdej pary populacji i sprawdzimy ich istotność statystyczną. F ST to miara zróżnicowania genetycznego populacji, wyrażana jako wariancja częstości alleli między populacjami; przyjmuje wartości od 0 do 1, 0 oznacza zupełny brak zróżnicowania między populacjami. Hipotezę zerową iż F ST = 0 Arlequin testuje testami randomizacyjnymi. Prawo Hardy ego-weinberga mówi iż w nieskończenie dużej populacji organizmów rozmnażających się płciowo, gdy kojarzenie jest losowe, pokolenia nie zachodzą na siebie, brak jest mutacji, migracji oraz doboru naturalnego lub też te trzy czynniki równoważą się, częstości alleli i genotypów nie będą zmieniały się z pokolenia na pokolenie, a częstości genotypów można obliczyć znając częstości alleli. W populacjach naturalnych zazwyczaj obserwuje się dobrą zgodność obserwowanej częstości genotypów z oczekiwanymi z prawa Hardy ego-weinberga. Dzieje się tak dlatego, iż jedno pokolenie losowego kojarzenia przywraca zgodność częstości obserwowanych i oczekiwanych, podczas gdy czynniki wywołujące odchylenia, jak dryf genetyczny czy dobór naturalny działają zazwyczaj w dłuższej skali czasowej. A zatem może być tak, że częstości alleli zmieniają się z pokolenia na pokolenie lecz jeżeli tylko kojarzenia są losowe, w każdym pokoleniu będziemy obserwować zgodność z prawem Hardy ego-weinberga. Hipotezę o braku odchyleń od równowagi Hardy ego-weinberga testujemy symulacjami Monte Carlo. Program generuje próby o liczebności i częstościach alleli takich jak w naszych danych, lecz przy założeniu równowagi Hardy ego-weinberga i sprawdza w jakiej części z tych prób odchylenia od wartości oczekiwanych będą większe niż dla naszych danych. Na podstawie tego wyniku oblicza istotność statystyczną testu. Omówione wyżej procedury to standardowe pierwsze kroki w analizie danych allelicznych. 1. Uruchom program WinArl35 i w karcie Arlequin configuration ODZNACZ XML Output.

Techniki molekularne ćw. 4 2 z 6 2. Wybierz Open Project i otwórz projekt Tg_MHC.arp 3. Przejdź do zakładki Settings i ustaw odpowiednie parametry jak poniżej:

Techniki molekularne ćw. 4 3 z 6 4. Naciśnij Run, postęp obliczeń widać w lewym dolnym brzegu okienka. 5. Po ukończeniu obliczeń wyniki zostaną zapisane w folderze Tg_MHC.res w kilku plikach, w przeglądarce otwieramy Tg_MHC_main.htm. 6. Odpowiedz na pytania: między którymi populacjami F ST jest największe? między którymi populacjami F ST nie jest istotne statystycznie, co to oznacza ze statystycznego a co z biologicznego punktu widzenia? między którymi populacjami zróżnicowanie częstości genotypów jest statystycznie istotne? w części Hardy-Weinberg equilibrium dla każdej populacji porównaj obserwowane (Obs. Het.) oczekiwane (Exp. Het.) heterozygotyczności oraz wyniki testów na

Techniki molekularne ćw. 4 4 z 6 równowagę Hardy ego-weinberga (P-value) dla poszczególnych loci w poszczególnych populacjach? Czy wszystkie loci we wszystkich populacjach są w równowadze Hardy ego-weinberga? A jeżeli nie to gdzie mamy odchylenia? O czym mogą one świadczyć w części Summary of computations done within populations porównaj liczbę alleli w poszczególnych loci, o czym mogą świadczyć obserwowane drastyczne różnice?

Techniki molekularne ćw. 4 5 z 6 II. MEGA5 analiza sekwencji DNA Program MEGA5 używany jest do konstrukcji i rysowania drzew filogenetycznych, szacowania dywergencji sekwencji, testowania działania doboru naturalnego na sekwencje kwasów nukleinowych i białek. Jest nowoczesnym i elastycznym, a przy tym bardzo prostym w użyciu narzędziem. W ćwiczeniu będziemy analizować 10 sekwencji fragmentu genu NCX (koduje wymiennik jonowy wapń-sód) u traszki zwyczajnej, karpackiej i grzebieniastej. Obejrzymy sekwencje nukleotydów i aminokwasów oraz skonstruujemy drzewo filogenetyczne obrazujące ich podobieństwa/pokrewieństwa. 1. Uruchom program Mega4 2. Wybierz File -> Open A File/Session... 3. Otwórz plik NCX.meg 4. Kliknij przycisk 5., Plik pojawi się w oknie przeglądarki, kropki oznaczają że dany nukleotyd jest identyczny we wszystkich sekwencjach. Aby zobaczyć całą długość sekwencji przewijaj w oknie 6. Kliknij przycisk, przełącza on między widokiem z kropkami a widokiem wszystkich sekwencji 7. Klikaj teraz przyciski z tej grupy C podświetla miejsca niezmienne V podświetla miejsca zmienne S podświetla mutacje występujące jedynie raz w zbiorze danych 0 podświetla miejsca niezdegenerowane, czyli takie w których dowolna zmiana spowoduje zmianę aminokwasu 2 podświetla miejsca dwukrotnie zdegenerowane, czyli takie w których tylko niektóre zmiany spowodują zmianę aminokwasu 4 podświetla miejsca czterokrotnie zdegenerowane, czyli takie w których żadna zmiana nie spowoduje zmiany aminokwasu W której z kategorii jest najmniej miejsc zmiennych? O czym to świadczy? 8. Kliknij przycisk, spowoduje to wyświetlenie sekwencji aminokwasów zamiast nukleotydów, czy zmienność aminokwasów jest taka sama, większa czy mniejsza niż zmienność nukleotydów? O czym to świadczy? 9. Zamknij okno Data Explorer 10. Wybierz z głównego Menu: Phylogeny -> Construct/Test Neighbor Joining Tree... i ustaw parametry następująco:

Techniki molekularne ćw. 4 6 z 6 11. Kliknij Compute, po krótkiej chwili w nowym oknie pokaże się skonstruowane drzewo. Co mówią nam długości gałęzi a co liczby nad niektórymi gałęziami? 12. Przyciskami po lewej stronie i u góry ekranu możesz manipulować wyglądem drzewa, zwróć uwagę że cały czas jest to samo drzewo, zmienia się jedynie sposób jego graficznej prezentacji. 13. Skonstruuj drzewo Neighbor-Joining używając procentu różnic aminokwasowych jako miary odległości genetycznej. Czy otrzymane drzewo różni się od tego uzyskanego z sekwencji nukleotydów? Dlaczego?