Macierze substytucji. PAM - Point Accepted Mutations Margaret Dayhoff Macierze substytucji zależna od prawdopodobieństwa mutacji

Podobne dokumenty
Pomiędzy elementami zbioru danych x (wektor p-cech) wyznaczane są wartości funkcji podobieństw lub niepodobieństwa d (dissimilarity; częściej)

Acknowledgement. Drzewa filogenetyczne

Wyrównanie sieci niwelacyjnej

WYKŁAD 5. Typy macierzy, działania na macierzach, macierz układu równań. Podstawowe wiadomości o macierzach

Grażyna Nowicka, Waldemar Nowicki BADANIE RÓWNOWAG KWASOWO-ZASADOWYCH W ROZTWORACH ELEKTROLITÓW AMFOTERYCZNYCH

Wykład 2. Granice, ciągłość, pochodna funkcji i jej interpretacja geometryczna

Fizyka. Kurs przygotowawczy. na studia inżynierskie. mgr Kamila Haule

WYZNACZANIE OGNISKOWEJ SOCZEWEK CIENKICH ZA POMOCĄ ŁAWY OPTYCZNEJ

W CZASIE WYKŁADU TELEFONY KOMÓRKOWE POWINNY BYĆ WYŁĄCZONE LUB WYCISZONE MAPY

Realizacje zmiennych są niezależne, co sprawia, że ciąg jest ciągiem niezależnych zmiennych losowych,

Macierz. Wyznacznik macierzy. Układ równań liniowych

a a a b M. Przybycień Matematyczne Metody Fizyki I

PRÓBNA MATURA Z MATEMATYKI Z OPERONEM LISTOPAD ,0. 3x 6 6 3x 6 6,

PODSTAWY ALGEBRY MACIERZY. Operacje na macierzach

Komisja Egzaminacyjna dla Aktuariuszy LII Egzamin dla Aktuariuszy z 15 marca 2010 r. Część I Matematyka finansowa

Małgorzata Żak. Zapisane w genach. czyli o zastosowaniu matematyki w genetyce

O RELACJACH MIĘDZY GRUPĄ OBROTÓW, A GRUPĄ PERMUTACJI

usuwa niewymierność z mianownika wyrażenia typu

Wykład 2. Pojęcie całki niewłaściwej do rachunku prawdopodobieństwa

Wymagania edukacyjne matematyka klasa 2 zakres podstawowy 1. SUMY ALGEBRAICZNE

Pierwiastek z liczby zespolonej

Wykład 6 Dyfrakcja Fresnela i Fraunhofera

Struktura energetyczna ciał stałych-cd. Fizyka II dla Elektroniki, lato

Katalog wymagań programowych na poszczególne stopnie szkolne. Matematyka. Poznać, zrozumieć

2. Tensometria mechaniczna

Wymagania edukacyjne matematyka klasa 2b, 2c, 2e zakres podstawowy rok szkolny 2015/ Sumy algebraiczne

Pierwiastek z liczby zespolonej

4. RACHUNEK WEKTOROWY

Porównywanie i dopasowywanie sekwencji

Macierz. Wyznacznik macierzy. Układ równań liniowych

2. FUNKCJE WYMIERNE Poziom (K) lub (P)

Legenda. Optymalizacja wielopoziomowa Inne typy bramek logicznych System funkcjonalnie pełny

Aby opisać strukturę krystaliczną, konieczne jest określenie jej części składowych: sieci przestrzennej oraz bazy atomowej.

Układy równań liniowych Macierze rzadkie

INSTRUKCJA. - Jak rozwiązywać zadania wysoko punktowane?

Propozycja przedmiotowego systemu oceniania wraz z określeniem wymagań edukacyjnych (zakres podstawowy)

Modelowanie i obliczenia techniczne. Metody numeryczne w modelowaniu: Różniczkowanie i całkowanie numeryczne

CAŁKOWANIE NUMERYCZNE

MATeMAtyka 3 inf. Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych. Zakres podstawowy i rozszerzony. Dorota Ponczek, Karolina Wej

O pewnych zgadnieniach optymalizacyjnych O pewnych zgadnieniach optymalizacyjnych

Maciej Grzesiak. Iloczyn skalarny. 1. Iloczyn skalarny wektorów na płaszczyźnie i w przestrzeni. a b = a b cos ϕ. j) (b x. i + b y

WYMAGANIA I KRYTERIA OCENIANIA Z MATEMATYKI W 3 LETNIM LICEUM OGÓLNOKSZTAŁCĄCYM

Jest błędem odwołanie się do zmiennej, której nie przypisano wcześniej żadnej wartości.

Algebra macierzowa. Akademia Morska w Gdyni Katedra Automatyki Okrętowej Teoria sterowania. Mirosław Tomera 1. ELEMENTARNA TEORIA MACIERZOWA

STYLE. TWORZENIE SPISÓW TREŚCI

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

Pochodne i całki, macierze i wyznaczniki

WEKTORY skalary wektory W ogólnym przypadku, aby określić wektor, należy znać:

Jest błędem odwołanie się do zmiennej, której nie przypisano wcześniej żadnej wartości.

Zadanie 5. Kratownica statycznie wyznaczalna.

Zastosowanie multimetrów cyfrowych do pomiaru podstawowych wielkości elektrycznych

Temat lekcji Zakres treści Osiągnięcia ucznia

PODSTAWY BIOINFORMATYKI 8 DOPASOWYWANIE SEKWENCJI AMINOKWASÓW

WYMAGANIA EDUKACYJNE Z MATEMATYKI DLA KLASY VIII w roku szkolnym 2015/2016

Matematyka finansowa r. Komisja Egzaminacyjna dla Aktuariuszy. LXVI Egzamin dla Aktuariuszy z 10 marca 2014 r. Część I

Metody określania macierzy przemieszczeń w modelowaniu przewozów pasażerskich. mgr inż. Szymon Klemba Warszawa, r.

Aparatura sterująca i sygnalizacyjna Czujniki indukcyjne zbliżeniowe LSI

PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI

Ćwiczenie 42 Wyznaczanie ogniskowych soczewek

PRÓBNY EGZAMIN MATURALNY Z INFORMATYKI

Translacja jako operacja symetrii. Wybór komórki elementarnej wg A. Bravais, połowa XIX wieku wybieramy komórkę. Symetria sieci translacyjnej

DZIAŁ 2. Figury geometryczne

( ) Elementy rachunku prawdopodobieństwa. f( x) 1 F (x) f(x) - gęstość rozkładu prawdopodobieństwa X f( x) - dystrybuanta rozkładu.

Rozwiązania maj 2017r. Zadania zamknięte

Praca, potencjał i pojemność

Rachunek prawdopodobieństwa i statystyka matematyczna.

Wyznacznik macierzy. - wyznacznik macierzy A

WEKTORY skalary wektory W ogólnym przypadku, aby określić wektor, należy znać:

PODSTAWY BAZ DANYCH Wykład 3 2. Pojęcie Relacyjnej Bazy Danych

Podstawy Techniki Cyfrowej Układy komutacyjne

Porównywanie i dopasowywanie sekwencji

Analiza matematyczna i algebra liniowa

Modelowanie zagadnień technicznych SKRYPT. Siergiej Fialko

NAJWAŻNIEJSZE WZORY. Pozostałe miary ruchu wyrażone przez miary ruchu obrotowego: wektor prędkości v = ω r wektor przyspieszenia stycznego a s

III.3 Transformacja Lorentza prędkości i przyspieszenia. Efekt Dopplera

CAŁKOWANIE NUMERYCZNE

Wymagania kl. 2. Uczeń:

Droga Pani/Drogi Panie! Wakacje minęły szybko i znowu możemy się spotkać. oraz za zabawami z koleżankami i kolegami.

Karta oceny merytorycznej wniosku o dofinansowanie projektu konkursowego PO KL 1

BADANIE ZALEŻNOŚCI PRZENIKALNOŚCI MAGNETYCZNEJ

Karta oceny merytorycznej wniosku o dofinansowanie projektu konkursowego PO KL 1

Wyznacznikiem macierzy kwadratowej A stopnia n nazywamy liczbę det A określoną następująco:

Wymagania edukacyjne z matematyki

Materiały pomocnicze do ćwiczeń z przedmiotu: Ogrzewnictwo, wentylacja i klimatyzacja II. Klimatyzacja

Kodowanie liczb. Kodowanie stałopozycyjne liczb całkowitych. Niech liczba całkowita a ma w systemie dwójkowym postać: Kod prosty

Zestaw 11- Działania na wektorach i macierzach, wyznacznik i rząd macierzy

Od lewej: piramida Chefrena, Wielki Sfinks, piramida Cheopsa.

PEWNIK DEDEKINDA i jego najprostsze konsekwencje

Wszystkim życzę Wesołych Świąt :-)

1 Definicja całki oznaczonej

Wprowadzenie: Do czego służą wektory?

Wyk lad 1 Podstawowe wiadomości o macierzach

3. F jest lewostronnie ciągła

Zbiory wyznaczone przez funkcje zdaniowe

Bioinformatyka Laboratorium, 30h. Michał Bereta

Spokrewnienie i inbred w małej populacji

2. PODSTAWY STATYKI NA PŁASZCZYŹNIE

Matematyka stosowana i metody numeryczne

guziny gwar i dialektów polskich nudle kónd Jak wykorzystać Mapę gwar i dialektów polskich na zajęciach? galanty

Przedmiotowy system oceniania z matematyki wraz z określeniem wymagań edukacyjnych (zakres podstawowy) Klasa II LO

Transkrypt:

Wykłd 8 Mcierze substytucji Sekwencje pokrewne Mcierze substytucji PAM - Point Accepted Muttions Mrgret Dyhoff 1978 BLOSUM Mcierze substytucji zleżn od prwdopodobieństw mutcji Jeśli koniecznie chcemy je porównć PAM120 przybliżenie z globlnego Point Accepted Muttions 120 mutcji/100 długości BLOSUM-62 z loklnego dopsowni BLOck SUbstitution Mtrix Co njmniej 62% identyczne

Jk wyznczmy mcierz substytucji W kżdej mcierzy substytucji częstotliwość q,b mutcji z do b wyzncz wrtości elementów mcierzy s,b,; p to prwdopodobieństwo wystąpieni minokwsu w cłej bzie dnych sekwencji ln( q, b / p pb) s, b = λ gdzie λjest jkimś współczynnikiem, chrkterystycznym dl typu mcierzy 7 Mcierze substytucji zleżn od prwdopodobieństw mutcji PAM120 przybliżenie z globlnego Point Accepted Muttions 120 mutcji/100 długości BLOSUM-62 z loklnego dopsowni BLOck SUbstitution Mtrix Co njmniej 62% identyczne Poprwk Poisson Liczb zobserwownych mutcji (d=p=d/l) jest zwykle zncznie mniejsz od rzeczywistej liczby mutcji bo byw kilk n 1 miejsce (np. mcierz PAM-120-120 mutcji n 100 miejsc) 9 Gdy mutcje zleżą od położeni w sekwencji Mcierze substytucji zleżne od pozycji Position Specific Scoring Mtrix (PSSM) Potrzeb mcierzy punktcji zleżnej od pozycji) Mcierze substytucji (typu PAM, BLOSUM) mogą być używne do: Dopsowywni pr sekwencji Oceny odległości ewolucyjnej pomiędzy prą biłek Wyszukni w bzie dnych biłek podobnych do biłek wybrnych Nie są wystrczjące do stwierdzeni, czy dne biłko jest elementem określonej rodziny (zbioru) biłek.

Jk wyznczmy mcierz częstości zleżną od pozycji (PSSM) Złóżmy, że mmy N sekwencji z jednej rodziny. Wyznczmy częstotliwość wystąpieni minokwsu n pozycjiudl tej rodziny sekwencji: q u, = n u, /N log( qu, / p) m u, = λ p to prwdopodobieństwo wystąpieni minokwsu w cłej bzie dnych sekwencji. Podobnie jk w mcierzy substytucji wyznczmy element mcierzy PSSM (λ możn tu pominąć, choć stosowne w Psi-Blst): 13 PSSM Etpy konstrukcji: Wybór rodziny do profilu: BLAST n podstwie pojedynczej sekwencji BLAST z kolejnych sekwencji Obliczenie PSSM 14 Entropi W fizyce ENTROPIA jest mirą gęstości stnów. Stnowi mirę kierunku zchodzeni procesów smorzutnych. Ukłd fizyczny zwsze dąży do nieporządku, czyli równomiernego rozkłdu (P i ) gęstości stnów i S = kb Pi ln ( Pi ) i ENTROPIA informcyjn (entropi Shnnon) jest mirą niepewności informcji H = P i log ( P i ) i k B stł Boltzmnn Im brdziej równomierny jest rozkłd jkiejś cechy tym mniej informcji mmy o jej potencjlnym wystąpieniu w określonej sytucji (np. minokwsu n dnej pozycji w sekwencji) 15 Entropi Istotność informcji w mcierzy PSSM dl kolumny umożn ocenić obliczjąc jej ENTROPIĘ po wszystkich minokwsch (w bitch to log 2 ): H u = qu, log 2( qu, ) Przy równomiernym występowniu wszystkich minokwsów entropi jest mksymln. Mx (H u ) = -20 * (1/20 * log 2 (1/20)) = log 2 (20) Informcj w sekwencji Informcj I u zwrt w sekwencji n pozycji umoże być obliczon jko: Iu = H mx Hu = log 2 20 Hu H mx = log 2 20, le pod wrunkiem, że dysponujemy co njmniej 20 sekwencjmi. Jeśli sekwencji jest mniej to H mx = log 2 (liczb sekwencji). Mksymln wrtość I u (mł entropi) ozncz brdzo dobrą konserwcję jkiegoś jednego minokwsu n pozycji u Logo Rozmir = I u q u, Schneider, Stephens, NAR,1990 16 18

Znjdownie biłek z określonej rodziny PSI-BLAST CEL: znmy zbiór biłek z jednej rodziny i znjdujemy biłk psujące Metody: Dopsownie do sekwencji konsensusowej(uśrednionej) rodziny Dopsownie do profilu rodziny Szuknie odcisku plc rodziny Metody probbilistyczne (np. ukryte modele Mrkow - HMM) Position-Specific Itertive BLAST Profil PSSM - Position-Specific Scoring Mtrix Wykłd Drzew Filogenetyczne Trdycyjne drzew pokrewieństw Drzew oprte były o podobieństw morfologiczne. Nie były binrne. Drzew filogenetyczne Drzewo jest grfem, który m głęzie, węzły i liście (końcówki, końcowe węzły) Drzewo może, le nie musi mieć korzeń Drzewo filogenetyczne to drzewo binrne Głęzie w drzewie filogenetycznym są skierowne 22 Hckel. E. Monophyletischer Stmbum der Orgnismen' from 'Generelle Morphologie der Orgnismen' (1866) with the three brnches Plnte, Protist, Animli 23 Węzły i liście odpowidją gtunkom lub sekwencjom molekulrnym i pokrewieństwom pomiędzy nimi Liście nzyw się w nim OUT ( Opertionl Txonomic Units ) 24

Drzew filogenetyczne Typy drzew filogenetycznych Tekstowy zpis drzew Kldogrm nie uwzględni czsu Drzewo ddytywne. Długości głęzi proporcjonlne do ilości mutcji n miejsce w sekwencji, skąd możn obliczyć odległość ewolucyjną. Drzewo może, le nie musi, mieć korzeń 25 Drzewo ultrmetryczne. Drzewo ddytywne, które dodtkowo m stłą szybkość mutcji wzdłuż głęzi (liczy się tylko czs). Skl po prwej pokzuje więc zrówno czs ewolucji, jk i (wyrównną) ilość mutcji n miejsce. 26 W tbeli mogą się również znleźć liczby określjące długości głęzi. 27 Zjwisk, którym podlegją geny (m.in. w sekwencjch homologicznych) Ortologi i Prlogi Ortologi/ Prlogi Duplikcj genów (również cłych chromosomów i genomów) Podził i ponowne połączenie frgmentów, le w innej kolejności Mutcjgenów (wewnątrz gtunku i międzygtunkowo) Zniknie genów po duplikcji (geny ciche - pseudogeny) Konwergencjgenów (homoplzjsekwencji) Poziomy(horyzontlny, lterlny) trnsfer genów HGT (Horizontl Gene Trnsfer) Geny ortologiczneto tkie, których rozdzielenie nstąpiło n skutek specjcji (po rozdzieleniu gtunków). Inczej mówiąc, w momencie specjcji gen mił tylko jedną kopię, dopiero później gen ewoluowł w rmch odrębnych gtunków, w kżdym niezleżnie Geny prlogiczneto tkie, których rozdzielenie nstąpiło w wyniku duplikcji genu (nie specjcji). Jeden gtunek m dwie kopie tego smego genu, które ewoluują niezleżnie od siebie, le w rmch tego smego gtunku. 28 29 30

Jk część genów jest ortologiczn? Zniknie (lub nieoznkownie) genów wpływ n odległości w drzewie Presj selektywn w pozycji 3 kodonu mutcje synonimowe Możliw losow zwrtość nukleotydu n 3 pozycji 31 32 33 Trnsfer poziomy genów (HGT), szczególnie bkterie Geny xenologowe pozornie b. podobne, jko efekt HGT 34 Trnsfer poziomy Rzęsistek pochwowy Science z 2007 roku doniósł o zsekwencjonowniu genomu, o wielkości ok. 160 M bp, z czego dwie trzecie to sekwencje powtórzeniowe (repetywne), lub trnspozonowe świdczy to o niedwnym rozszerzeniu genomu, związnym z przystosowniem do psożytniczego trybu życi, wynikłym z poziomego trnsferu genu od bkterii i późniejszym mplifikcjom odpowiednich rodzin genowych. Odległ grup (różne enzymy z jednej superodziny) 35 Jk wyznczyć dobre drzewo? 1. Wybrć rodzinę sekwencji homologicznych jko OTU Sekwencje powinny mieć wystrczjąco silny sygnł filogenetyczny. Jeśli sygnł jest słby (sekwencje są brdzo rozbieżne) to drzewo powstnie, le nie będzie zbyt informtywne Sekwencje muszą pochodzić z genów, które mją odpowiednio dużą, le nie zbyt dużą szybkość mutcji W wybrnych gench nie powinno być poziomego trnferu genów Sekwencje musz pochodzić z odpowiednich genów (ortologi, nie prlogi). 36

Geny, które spełniją złożeni Prokriot sekwencj DNA młej podjednostki rybosomu rrna(16s RNA). Mimo, że w niektórych genomch pojwi się w kilku kopich (n tej podstwie wyodrębniono Bcteri i Arche Crl Woese) Bkterie enzymy DNA: GyrA, GyrB, biłko chperonowe HSP60. Zwierzęt segment (648 bp) z cytochromu c oksydz I Jk wyznczyć dobre drzewo 37 38