danych jest Swiss-Prot. Przeszukiwanie baz danych jest jedna
|
|
- Bogusław Mazurkiewicz
- 8 lat temu
- Przeglądów:
Transkrypt
1 Wst ep do obliczeniowej biologii molekularnej (J. Tiuryn, wykĺad nr.6, 23 listopada 2005) Spis treści 3 Przeszukiwanie baz danych Heurystyczne algorytmy FASTA BLAST Statystyka porównywania sekwencji PSI-BLAST Uliniowienie sekwencji z profilem Macierze substytucyjne PAM BLOSUM Przeszukiwanie baz danych Jest dużo baz dnaych specjalizujacych sie w różnych aspektach zwiazanych z sekwencjami naturalnie pojawiajacymi sie w biologii. Dla sekwencji DNA g lówne bazy danych to: GenBank (USA), EMBL (Europa), DDBJ (Japonia). Natomiast dla bia lek g lówna baza danych jest Swiss-Prot. Przeszukiwanie baz danych jest jedna z g lównych metod pracy wspó lczesnego biologa. Poniżej omówimy kilka zagadnień zwiazanych z praktycznymi aspektami przeszukiwania baz. 3.1 Heurystyczne algorytmy Omówimy dwa najbardziej popularne heurystyczne algorytmy używane do obliczania przybliżonej wartości lokalnego uliniowienia. Algorytmy te stanowia standardowe narzedzie do przeszukiwania baz danych w procesie wyszukiwania podobieństw pomiedzy sekwencjami FASTA Jest to heurystyczny algorytm (Lipman, Pearson, 1985) s lużacy do przybliżonego obliczania lokalnego uliniowienia danego wzorca Q wzgledem tekstowej sekwencji T wzietej z bazy danych. Zwykle stosuje sie go do kolejnych sekwencji z bazy danych. Na poczatku użytkownik wybiera liczbowy parametr, zwany ktup. Standardowo sugerowane wartości dla ktup to 6 dla 36
2 sekwencji DNA oraz 2 dla bia lek. Przyjmijmy, że k jest wartościa parametru ktup. Przez k-s lowo bedziemy rozumieć dowolne s lowo d lugości k. Niech n = Q oraz m = T. Dzia lanie algorytmu można przedstawić w nastepuj acych czterech krokach. 1. Dla 1 i n, 1 j m algorytm znajduje pary (i, j), takie że k- s lowo zaczynajace sie w Q w pozycji i jest identyczne z k-s lowem zaczynajacym sie w T w pozycji j. Każda taka para (i, j) nazywa sie goracym miejscem. Operacje te można wykonać efektywnie sporzadzaj ac na poczatku tablice haszujac a dla Q, lub (rzadziej) dla wszystkich s lów T z bazy danych. 2. Każde gorace miejsce (i, j) można traktować jako odcinek d lugości k leżacy na przekatnej o numerze 1 (i j) w tablicy V (otrzymanej metoda dynamicznego programowania V oczywiście nie mamy). Algorytm przypisuje pewne wartości dodatnie goracym miejscom oraz wartości ujemne przerwom pomiedzy takimi miejscami (im d luższa przerwa, tym mniejsza wartość). Dla każdej przekatnej zawierajacej gorace miejsce, algorytm wybiera fragment pomiedzy goracymi miejscami o maksymalnej wartości. W ten sposób zostaje wybranych 10 przekatnych (i zawartych w nich fragmentów) o maksymalnej wartości. Dla każdego z tych fragmentów algorytm znajduje cześć takiego fragmentu (pods lowo) o maksymalnej wartości uliniowienia bez spacji (do obliczania tej wartości stosuje sie tablice PAM lub BLOSUM) Taka cześć fragmentu nazwiemy poduliniowieniem. Niech init1 bedzie najlepszym poduliniowieniem. 3. Wybrane sa poduliniowienia, których wartość przekracza pewna z góry ustalona granice. Z tych dobrych poduliniowień próbuje sie u lożyć uliniowienie o maksymalnej wartości. W tym celu buduje sie nastepuj acy graf poduliniowień. Wierzcho lkami sa poduliniowienia. Każdemu wierzcho lkowi jest przypisana liczba bed aca wartościa tego poduliniowienia. Jeśli u i v sa poduliniowieniami, takimi że u zaczyna sie w pozycji (i, j) i kończy w pozycji (i + d, j + d), a v zaczyna sie w pozycji (i, j ), to tworzymy krawedź od u do v, gdy i > i + d oraz j > j + d, tzn gdy wiersz (kolumna) w którym zaczyna sie v jest poniżej wiersza (na prawo od kolumny), w którym kończy sie u. Krawedzi tej przypisujemy pewna wage zależac a od liczby spacji jakie trzeba wprowadzić we fragmencie lokalnego uliniowienia, w którym poduliniowienie v wystepuje po poduliniowieniu u. Im wieksza liczba spacji tym waga takiej krawedzi jest 1 G lówna przekatna ma numer 0, przekatne o numerach dodatnich leża nad g lówna przekatn a, a o numerach ujemnych pod g lówna przekatn a. 37
3 mniejsza. Nastepnie algorytm znajduje droge o maksymalnej wartości w wyżej opisanym grafie. Taka droga wyznacza lokalne uliniowienie pomiedzy dwoma s lowami. To nie musi być optymalne lokalne uliniowienie pomiedzy Q oraz T. Oznaczmy to uliniowienie przez initn. 4. Algorytm wraca do poduliniowienia init1 z kroku 2 i znajduje najlepsze lokalne uliniowienie wokó l przekatnej zawierajacej init1 w pasie [ 8, 8] (dla bia lek) oraz w pasie [ 16, 16] (dla DNA). Niech opt bedzie takim uliniowieniem. W ten spsób Q jest porównywane z kolejnymi s lowami T z bazy danych. Biorac pod uwage opt lub initn wyznacza sie ma l a liczbe s lów T, najbardziej obiecujacych z punktu widzenia uliniowienia z Q. Dla każdego z nich wykonuje sie pe lny algorytm Smitha-Watermana obliczajacy optymalne uliniowienia BLAST Algorytm BLAST (Altschul et.al. 1990) podaje jako wynik ca le spektrum rozwiazań (uliniowień) wraz z oszacowaniem statystycznej istotności znalezionego rozwiazania (czyli prawdopodobieństwa tego, że znaleziona wartość, lub wartość od niej wieksza mog la sie pojawić przypadkiem (z losowej sekwencji)). BLAST porównuje wzorzec Q z każda sekwencja z bazy danych, starajac sie zidentyfikować te sekwencje T, dla których MSP (maximal segment pair, czyli para pods lów równej d lugości maksymalizujaca wartość uliniowienia bez spacji 2 ) jest wieksze od pewnej z góry ustalonej wartości C. W ten sposób wybiera sie pewne s lowa T podejrzane o pewne podobieństwo z Q. Jak sie szuka takich T, dla których MSP jest wieksze od C? Ustala sie d lugość w oraz wartość graniczna t. Nastepnie BLAST znajduje wszystkie w-pods lowa w T, dla których istnieje w-pods lowo w Q o wartości uliniowienia (bez spacji) wiekszej od t. Każde takie miejsce jest rozszerzane w celu znalezienia wartości uliniowienia wiekszej od C. Jeśli w trakcie rozszerzania wartość uliniowienia (która może rosnać lub maleć z każdym krokiem rozszerzenia) spadnie poniżej pewnej wartości progowej, to poszukiwania dla takiego miejsca sa przerywane. Dobór wartości C, w oraz t ma kluczowe znaczenie dla jakości znajdowanych wyników. Na przyk lad, dla porównywania bia lek w jest przyjmowane pomiedzy 3 a 5, natomiast dla DNA jest zwykle równe oko lo Przy użyciu pewnej macierzy substytucyjnej. 38
4 3.1.3 Statystyka porównywania sekwencji Poniżej przedstawimy podstawowe wyniki teorii (Karlin, Altschul 1990), na której BLAST opiera analiz e statystycznej istotności znalezionego wyniku uliniowienia. Teoria ta nie dotyczy uliniowień ze spacjami. Opracowanie analogicznej teorii dla uliniowień ze spacjami stanowi problem otwarty. Analiza jednej sekwencji Na poczatek zajmiemy sie analiza probabilistyczna jednej sekwencji. Dany jest alfabet A = {a 1,..., a r }, z którego losowany jest ciag liter o prawdopodobieństwach {p 1,..., p r }. Z każdym wystapieniem litery a i w sekwencji zwiazana jest wartość s i bed aca liczba rzeczywista. Przyjmujemy nastepuj ace za lożenia: 1. Dla pewnego i mamy s i > Wartość oczekiwana wartości dla ca lego alfabetu jest ujemna: r p i s i < 0. Rozważamy zmienna losowa M(n) przyjmujac a wartość maksymalna dla segmentu w losoowej sekwencji d lugości n. Twierdzenie Wartość oczekiwana dla M(n) jest rzedu ln n, gdzie jest jedynym dodatnim rozwiazaniem równania Twierdzenie Prob r p i e λ s i = 1. ( M(n) ln n ) > x 1 e x, K e λ gdzie K jest sta l a zadana szybko zbieżnym szeregiem. Zatem wycentrowna zmienna losowa M = m(n) ln n ma rozk lad EVD (extreme value distribution), zwany też rozk ladem Gumbela. Ponadto oczekiwana liczba wystapień segmentów w losowej sekwencji d lugości n, o wartości wiekszej niż ln n + x wynosi K e λ x. Powyższe twierdzenie wynika z nastepuj acej ogólniejszej uwagi: liczba wystapień oddzielnych segmentów o wysokiej wartości (tzn. o wartości wiekszej niż ln n +x) jest aproksymowane przez rozk lad Poissona o parametrze a = K e λ x. 39
5 Przypomnijmy, że rozk lad Poissona o parmetrze a dla zmiennej losowej x przyjmujacej wartości naturalne wyglada nastepuj aco Prob (X = k) = ak k! e a. Zatem prawdopodobieństwo napotkania m lub wiecej różnych segmentów o dużej wartości wynosi 1 e a m 1 a i. Przyjmuj ac i! m = 1 dostajemy pierwsza cześć twierdzenia. Druga cześć wynika natychmiast z faktu, że wartość oczekiwana dla zmiennej losowej o rozk ladzie Poissona z parametrem a wynosi E(X) = a. Niech S = ln n +x bedzie wartościa segmentu w losowej sekwencji d lugości n. Wówczas, zgodnie z Twierdzeniem 3.1.2, oczekiwana liczba wystapień segmentów roz l acznych o wartości co najmniej S wynosi K e λ x = K e ln n λ S = K n e λ S. To jest w laśnie tzw. E-value obliczane przez program BLAST. E = K n e λ S. Statystyka porównywania dwóch sekwencji Mamy dwie sekwencje: jedna losowana z rozk ladem na literach {p 1,..., p r }, a druga z rozk ladem {p 1,..., p r}. Ponadto mamy tablice substytucyjna (s i,j ) 1 i,j r. Przyjmujemy nastepuj ace za lożenia: 1. i,j p ip js i,j < 0, oraz 2. Dla pewnych i, j, mamy s i,j > Rozk lady {p 1,..., p r } oraz {p 1,..., p r } nie różni a sie zbytnio od siebie. 3 Dalej analiza wyglada podobnie do przypadku jednej sekwencji o d lugości m n, gdzie m i n sa d lugościami losowych sekwencji. W szczególności niech bedzie jedynym dodatnim rozwiazaniem równania i,j p ip j eλs i,j = 1. Niech M(m, n) bedzie zmienna losowa wyrażajac a maksymalna wartość lokalnego uliniowienia (bez spacji) losowych s lów o d lugościach m oraz n generowanych z powyższych rozk ladów. Wówczas mamy nastepuj ace twierdzenie ( ) ln mn Prob M(m, n) > + x 1 e x. K e λ Jest to tzw. wartość p-value, czyli prawdopodobiństwo tego, że można uliniowić par e losowych sekwencji o d lugościach m oraz n tak, że natrafimy na 3 Techniczna definicje tego za lożenia pomijamy tutaj, odsy lajac zainteresowanego czytelnika do publikacji. 40
6 ln mn segment uliniowienia (bez spacji) o wartości przekraczajacej + x. Ponadto oczekiwana liczba segmentów o wartości przekraczajacej ln mn S = + x wynosi E = K e λ x = K m n e λ S. Jest tzw. E-value. Program BLAST używa wartości E-value zamiast p-value ze wzgledu na wiekszy zakres wartości przyjmowanych w przypadku E-value. Zauważmy, że dla ma lych wartości E-value (np. dla E<0.01) obie wartości sa niemal identyczne. Wartości sta lych K oraz zależa od tablicy substytucyjnej oraz od rozk ladów na literach. Przyk ladowo, dla tablicy BLOSUM62 oraz rozk ladzie na aminokwasach obliczonym dla danych zawartych w bazie danych mamy = oraz K = Obserwowana wartość S zwykle zastepuje sie tzw. wartościa znormalizowana S (mierzona w bitach), czyli taka wartościa aby zachodzi la zależność E = m n 2 S. Latwo jest policzyć, że wówczas mamy S = λ S ln K. ln 2 Tak wiec znormalizowana wartość lokalnego uliniowienia oraz E-value sa ze soba ściśle zwiazne i zwiazek ten zależy jedynie od rozmiaru obydwu sekwencji. Przyk ladowo dla sekwencji d lugości 250 oraz bazy danych zawierajacej 50 milionów znaków E-value odpowiada znormalizowanej wartości uliniowienia oko lo 38 bitów PSI-BLAST Program PSI-BLAST (Position-Specific Iterated BLAST), a w laściwie rodzina programów, powsta l w 1997r. Zawiera on szereg ulepszeń w stosunku do starszej wersji. Trzy g lówne ulepszenia wymienione sa poniżej. 1. Poszukiwanie par hitów na przekatnych, zamiast pojedynczych hitów. Prowadzi to do wiekszej wrażliwości. 2. Dopuszczenie przerw w uliniowieniach oraz statystyczna analiza dla przerw. Nie ma tutaj wspierajacej teorii, ale symulacje komputerowe pokazuja, że rozk lady maja podobny kszta lt jak w przypadku uliniowień bez przerw. Sta le oraz K wylicza sie eksperymentalnie (symulacje stochastyczne). 3. Iteracyjnie konstruuje sie profil (inaczej PSSM - Position-Specific Score Matrix) i przeszukuje baze danych uliniawiajac profil z kolejnymi sek- 41
7 wencjami (por. rozdzia l poświecony uliniowieniu profilu a sekwencja). Profil, na danym kroku, powstaje przez wziecie wszystkich istotnych uliniowień z wrorcem (z poprzedniego kroku). Takie wielokrotne uliniowienie wyznacza nowy profil, który staje sie nowym wzorcem. Iteracja kończy sie po zadanej liczbie kroków. Szerokość profilu jest równa d lugości poczatkowego wzorca. Jako przyk lad zastosowania programu PSI-BLAST autorzy podaja eksperyment biorac jako wzorzec ludzkie bia lko HIT do przeszukania bazy danych SWISS-PROT. Znalezione zosta ly (jako statystycznie istotne) tylko inne bia lka z rodziny HIT o wartości E-value mniejszej niż Porównujac struktury stwierdzono, że HIT jest istotnie podobne do bia lka GalT (ze szczura). Wartość E-value z BLAST a dla tych dwóch bia lek wynosi 0.012, a wiec nieco poniżej wyżej wymienionej wartości progowej. Po pierwszej iteracji PSI-BLAST wartość E-value dla GalT (ze szczura) spad la do , a ponadto odkryto inne bia lko GalT (z bakterii H. influenzae) o wartości E-value równej Po drugiej iteracji odkryto podobieństwo o wartości E-value równej do pewnego bia lka z drożdży, dla którego struktura nie jest znana Uliniowienie sekwencji z profilem Przypuśćmy, że mamy rodzine sekwencji uliniowiona w nastepuj acy sposób: a b c - a a b a b a a c c b - c b - b c Powyższe ulinowienie generuje profil w nastepuj acy sposób. Dla każdej kolumny i każdego symbolu (również spacji) liczymy czestość wystapienia tego symbolu w kolumnie. W ten sposób powstaje tablica P = (p x,i ), gdzie x przebiega po wszystkich symbolach, a i przebiega po numerach kolumn. Ta tablica nazywa sie profilem. W naszym przyk ladzie mamy nastepuj acy profil: a b c
8 Tak wiec profil jest skończonym ciagiem rozk ladów prawdopodobieństwa na zbiorze symboli Σ { }. Majac dane s lowo S Σ oraz profil P, uliniowienie S z P jest to każde ustawienie symboli z S z kolumnami z P (z możliwościa wstawiania spacji zarówno pomiedzy symbole z S, jak i pomiedzy kolumny z P ), przy którym spacja nie stoi na wprost spacji. Przyjmujemy, że mamy rozk lad prawdopodobieństwa p odpowiadajacy spacji wstawianej do sekwencji profilu. Rozk lad ten jest skupiony na symbolu, tzn. p ( ) = 1 oraz p (x) = 0 dla x. Przyk ladem uliniowienia dla powyższego profilu P ze s lowem aabbc jest a a b - b c Zatem w ogólności uliniowieniem s lowa S z profilem P jest para s lów S # (Σ { }), P # (N { }), taka że 1. S # = P #. 2. S #, po usuni eciu spacji daje S. 3. P #, po usunieciu spacji, daje ciag 1... n. 4. Dla każdego i, S # (i) oraz P # (i) nie sa jednocześnie spacja. Wartościa ulin- Niech s : (Σ { }) 2 R bedzie funkcja podobieństwa. iowienia (S #, P # ) jest liczba S # s(s # (i), P # (i)), gdzie dla x Σ { } oraz dla rozk ladu p i (gdzie i {1,..., n} { }) wystepuj acego w profilu P, s(x, i) = s(x, y) p i (y). y Σ { } W naszym przyk ladzie, jeśli funkcja podobieństwa jest { 1 jeśli x = y, s(x, y) = 1 jeśli x y, to wartość ulinowienia przedstawionego powyżej wynosi =
9 Problem znajdowania optymalnego uliniowienia s lowa z profilem rozwiazuje sie, używajac metody dynamicznego programowania, w taki sam sposób jak dla przypadku dwóch s lów. Jedyna różnica polega na tym, że obecnie mamy do czynienia z dwoma alfabetami, nad którymi sa brane s lowa: Σ oraz zbiór rozk ladów prowdopodobieństw nad Σ { }. Ponieważ koszt obliczania wartości podobiebieństwa s(x, i) wynosi O( Σ ) (przyjmujemy koszt liczenia s(x, y) oraz p i (y) jako jednostkowe), to ca lkowity czas, w którym znajdujemy optymalne uliniowienie s lowa S z profilem P wynosi O( Σ m n), gdzie m = S, n = P (tzn. P jest ciagiem n rozk ladów). 3.2 Macierze substytucyjne Zacznijmy od paru ogólnych uwag. Za lóżmy, że dla liter a, b Σ, q a,b jest prawdopodobieństwem tego, że aminokwasy a oraz b pochodza od wspólnego aminokwasu (przodka) w drodze punktowej mutacji. Mamy dane dwa s lowa x = x 1... x n oraz y = y 1... y n. Chcemy obliczyć jakie jest prawdopodobieństwo tego że x oraz y pochodza od wspólnego przodka w wyniku punktowych zmian. Dla dowolnej litery a, niech p a oznacza prawdopodobieństwo wystapienia litery a w s lowie. Wówczas prawdopodobieństwo pojawienia sie s lów x oraz y to n n p xi p yi. Natomiast prawdopodobieństwo tego, że x i y pochodza od wspólnego przodka jest równe n q x i,y i. Iloraz tych dwóch wartości n q xi,y i p xi p yi nazywa sie odds ratio. Im wieksza jest ta wartość tym bardziej dane dwa s lowa x, y nie sa ca lkowicie losowe (niezależne), ale pochodza od wspólnego przodka. Ponieważ dużo wygodniej jest pracować z addytywna miara podobieństwa, to przechodzimy do logarytmu: s(x, y) = n log( q x i,y i p xi p yi ), liczba jest kara/nagrod a za zamiane a na b. s(a, b) = log( q a,b p a p b ) 44
10 3.2.1 PAM Macierze PAM (percent accepted mutations) zosta ly zaproponawane przez M. Dayhoff i jej wspó lpracowników oko lo 1978r. Sa to tzw. macierze substytucyjne dla aminokwasów i jako takie reprezentuja funkcje podobieństwa. PAM również używa sie jako jednostki miary opisujacej ewolucyjna rozbieżność pomiedzy dwoma ciagami aminokwasów. Powiemy, że dwa s lowa S 1 i S 2 różnia sie o jedna jednoske PAM, jeśli S 2 można otrzymać z S 1 w ciagu akceptowalnych punktowych mutacji, tak że średnia liczba akceptowalnych mutacji na 100 aminokwasów wynosi 1. Akceptowalna punktowa mutacja to taka, która albo nie zmieni la funkcji bia lka, lub by la korzystna dla organizmu (co najmniej nie spowodowa la śmierci organizmu). Zwróćmy uwage, że różnica 1PAM pomiedzy S 1 i S 2 nie oznacza, że s lowa te różnia sie pomiedzy soba o 1%. Liczba mutacji na pewnej pozycji w s lowach może być wieksza od jedynki, a nawet w wyniku tych mutacji ta pozycja nie musi sie zmienić. Jako podstawe do budowy macierzy PAM wzieto pewna rodzine bardzo podobnych bia lek (każde dwa nie różni ly sie o wiecej niż 15%) i recznie sporzadzono globalne uliniowienia dla tej rodziny. Nastepnie stworzono tablice A, taka że dla aminokwasów a, b, A(a, b) jest liczba wystapień ulinowienia pary (a, b) w wyżej wymienionych uliniowieniach. Wówczas prawdopodobieństwo mutacji z a na b jest równe q a,b = A(a, b) A(a, c). c Niech p a bedzie prawdopodobieństwem wystapienia litery a w w/w bia lkach. Wówczas wartość oczekiwana (średnia) liczby zamian w losowej parze s lów d lugości m wynosi m p a p b q a,b. a,b Ponieważ macierz 1PAM to taka, dla której powyższa wartość oczekiwana wynosi 1 dla m = 100, to musimy tak przeskalować q a,b na q a,b aby zachodzi lo p a p b q a,b = a,b Wystarczy stosownie dobrać sta l a d i wziać: { q a,b d q a,b dla a b, = d q a,b + (1 d) dla a = b. W ten sposób otrzymujemy 1PAM macierz. Oznaczmy ja przez S(1). Tak wiec (w przybliżeniu) S(1)(a, b) jest prawdopodobieństwem zamiany a na b w 45
11 jednej umownej jednostce czasu. Macierz S(1) przedstawia pewien lańcuch Markowa. Prawdopodobieństwo zamiany a na b w n jednostkach czasu to S(1) n (a, b), gdzie S(1) n jest n-krotnym iloczynem macierzy S(1) przez siebie. Macierze S(1) n nazywaja sie npam macierzami. Wartości do prawdziwej macierzy npam sa brane z S(1) n przez stosowanie logarytmu, skalowanie i zaokraglanie. Bardzo popularne sa 250PAM macierze BLOSUM Macierze substytucyjne BLOSUM (blocks substitution matrix) zosta ly zaproponawane przez S. oraz J. Heinkoff w 1991r. jako efekt krytyki tego, że macierze npam dla n >> 1 nie oddaja dobrze wp lywu czasu na zmiany sekwencji kodujacych bia lka. Macierze BLOSUM zosta ly oparte na bia lkowej bazie danych BLOCKS w nastepuj acy sposób. Niech 0 L 100. Opiszemy sposób budowania macierzy BLOSUML. Bia lka z bazy danych sa dzielone na grupy. Do jednej grupy sa zaliczane dwa bia lka jeśli można przejść od jednego bia lka do drugiego, używajac bia lek pośrednich wzietych z bazy danych, takich że każde dwa kolejne bia lka maja sk lad identyczny w co najmniej L%. Bia lka w bazie danych BLOCKS sa uliniowione w tzw. blokach. Tworzymy macierz A. Wybierzmy dwie grupy g, g. Dla aminokwasów a, b, liczba A g,g (a, b) jest czestości a z jaka aminokwas a pochodzacy z grupy g jest uliniowiony z aminokwasem b pochodzacym z grupy g (liczba ta jest podzielona przez n n, gdzie n jest licznościa grupy g, a n jest licznościa grupy g ). A(a, b) otrzymuje sie przez sumowanie A g,g (a, b) po wszystkich parach grup g, g. Majac A możemy obliczyć prawdopodobieństwo wystapienia aminokwasu a: p a = b A(a, b) A(c, d) oraz prawdopodobieństwo zamiany a na b: c,d q a,b = A(a, b) A(c, d). c,d Wówczas s(a, b) = log( q a,b p a p b ). Najcz eściej używane L to L = 50 oraz L =
3 Przeszukiwanie baz danych
Spis treści 3 Przeszukiwanie baz danych 1 3.1 Heurystyczne algorytmy...................... 1 3.1.1 FASTA........................... 1 3.1.2 BLAST........................... 3 3.2 Macierze substytucyjne.......................
Wyk lad 5 W lasności wyznaczników. Macierz odwrotna
Wyk lad 5 W lasności wyznaczników Macierz odwrotna 1 Operacje elementarne na macierzach Bardzo ważne znaczenie w algebrze liniowej odgrywaja tzw operacje elementarne na wierszach lub kolumnach macierzy
Wyk lad 7 Metoda eliminacji Gaussa. Wzory Cramera
Wyk lad 7 Metoda eliminacji Gaussa Wzory Cramera Metoda eliminacji Gaussa Metoda eliminacji Gaussa polega na znalezieniu dla danego uk ladu a x + a 2 x 2 + + a n x n = b a 2 x + a 22 x 2 + + a 2n x n =
Wyk lad 3 Wyznaczniki
1 Określenie wyznacznika Wyk lad 3 Wyznaczniki Niech A bedzie macierza kwadratowa stopnia n > 1 i niech i, j bed a liczbami naturalnymi n Symbolem A ij oznaczać bedziemy macierz kwadratowa stopnia n 1
2 Podobieństwo dwóch sekwencji
Wst ep do obliczeniowej biologii molekularnej (J. Tiuryn, wykĺad nr.3-4, 8 listopada 2005) Spis treści 2 Podobieństwo dwóch sekwencji 15 2.1 Globalne uliniowienie....................... 16 2.1.1 Metoda
Wyk lad 7 Baza i wymiar przestrzeni liniowej
Wyk lad 7 Baza i wymiar przestrzeni liniowej 1 Baza przestrzeni liniowej Niech V bedzie przestrzenia liniowa. Powiemy, że podzbiór X V jest maksymalnym zbiorem liniowo niezależnym, jeśli X jest zbiorem
Wyk lad 4 Dzia lania na macierzach. Określenie wyznacznika
Wyk lad 4 Dzia lania na macierzach Określenie wyznacznika 1 Określenie macierzy Niech K bedzie dowolnym cia lem oraz niech n i m bed a dowolnymi liczbami naturalnymi Prostokatn a tablice a 11 a 12 a 1n
WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ
WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ Dana jest populacja generalna, w której dwuwymiarowa cecha (zmienna losowa) (X, Y ) ma pewien dwuwymiarowy rozk lad. Miara korelacji liniowej dla zmiennych (X, Y
Statystyka w analizie i planowaniu eksperymentu
31 marca 2014 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś
ep do obliczeniowej biologii molekularnej (J. Tiuryn, wykĺady nr. 12 i 13; 25 stycznia 2006) 8 Konstrukcja drzew filogenetycznych
Wst ep do obliczeniowej biologii molekularnej (J. Tiuryn, wykĺady nr. 2 i 3; 25 stycznia 2006) Spis treści 8 Konstrukcja drzew filogenetycznych 82 8. Metoda UPGMA......................... 82 8.2 Metoda
2 Podobieństwo dwóch sekwencji. 2.2 Lokalne uliniowienie Przerwy w uliniowieniach Dowolna wartość kary za przerwe
Wst ep do obliczeniowej biologii molekularnej (J. Tiuryn, wykĺad nr.5, 22 listopada 2005) Spis treści 2 Podobieństwo dwóch sekwencji 25 2.2 Lokalne uliniowienie....................... 25 2.3 Przerwy w
Wyk lad 4. Grafy skierowane
Wyk lad 4 Grafy skierowane Definicja Graf skierowany G sk lada si e z dwóch zbiorów, niepustego zbioru V (G) grafu G i zbioru E(G) kraw edzi grafu G oraz z funkcji γ (gamma) ze zbioru E(G) w zbiór V (G)
Statystyka w analizie i planowaniu eksperymentu
29 marca 2011 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś
Wyk lad 8 macierzy i twierdzenie Kroneckera-Capellego
Wyk lad 8 Rzad macierzy i twierdzenie Kroneckera-Capellego 1 Określenie rz edu macierzy Niech A bedzie m n - macierza Wówczas wiersze macierzy A możemy w naturalny sposób traktować jako wektory przestrzeni
Statystyka w analizie i planowaniu eksperymentu
22 marca 2011 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś
Wyk lad 9 Baza i wymiar przestrzeni liniowej
Wyk lad 9 Baza i wymiar przestrzeni liniowej 1 Operacje elementarne na uk ladach wektorów Niech α 1,..., α n bed dowolnymi wektorami przestrzeni liniowej V nad cia lem K. Wyróżniamy nastepuj ace operacje
Wyk lad 4 Macierz odwrotna i twierdzenie Cramera
Wyk lad 4 Macierz odwrotna i twierdzenie Cramera 1 Odwracanie macierzy I n jest elementem neutralnym mnożenia macierzy w zbiorze M n (R) tzn A I n I n A A dla dowolnej macierzy A M n (R) Ponadto z twierdzenia
Wyk lad 9 Podpierścienie, elementy odwracalne, dzielniki zera
Wyk lad 9 Podpierścienie, elementy odwracalne, dzielniki zera Określenie podpierścienia Definicja 9.. Podpierścieniem pierścienia (P, +,, 0, ) nazywamy taki podzbiór A P, który jest pierścieniem ze wzgledu
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 28 listopada 2018 Plan zaj eć 1 Rozk lad estymatora b 2 3 dla parametrów 4 Hipotezy l aczne - test F 5 Dodatkowe za lożenie
Niezmienniki i pó lniezmienniki w zadaniach
Niezmienniki i pó lniezmienniki w zadaniach Krzysztof Che lmiński Wydzia l Matematyki i Nauk Informacyjnych Politechnika Warszawska MiNI-Akademia Matematyki Warszawa, 2 marca, 2013 Na czym polega metoda
Wyk lad 2 Podgrupa grupy
Wyk lad 2 Podgrupa grupy Definicja 2.1. Pod grupy (G,, e) nazywamy taki podzbiór H G, że e H, h 1 H dla każdego h H oraz h 1 h 2 H dla dowolnych h 1, h 2 H. Jeśli H jest grupy G, to bedziemy pisali H G.
celu przyjmijmy: min x 0 = n t Zadanie transportowe nazywamy zbilansowanym gdy podaż = popyt, czyli n
123456789 wyk lad 9 Zagadnienie transportowe Mamy n punktów wysy lajacych towar i t punktów odbierajacych. Istnieje droga od każdego dostawcy do każdego odbiorcy i znany jest koszt transportu jednostki
Wyk lad 11 1 Wektory i wartości w lasne
Wyk lad 11 Wektory i wartości w lasne 1 Wektory i wartości w lasne Niech V bedzie przestrzenia liniowa nad cia lem K Każde przekszta lcenie liniowe f : V V nazywamy endomorfizmem liniowym przestrzeni V
Architektura systemów komputerowych
Architektura systemów komputerowych Grzegorz Mazur Zak lad Metod Obliczeniowych Chemii Uniwersytet Jagielloński 12 kwietnia 2011 Grzegorz Mazur (ZMOCh UJ) Architektura systemów komputerowych 12 kwietnia
Niesimpleksowe metody rozwia zywania zadań PL. Seminarium Szkoleniowe Edyta Mrówka
Niesimpleksowe metody rozwia zywania zadań PL Seminarium Szkoleniowe Metoda Simplex: wady i zalety Algorytm SIMPLEX jest szeroko znany i stosowany do rozwi azywania zadań programowania liniowego w praktyce.
13 Zastosowania Lematu Szemerédiego
13 Zastosowania Lematu Szemerédiego 13.1 Twierdzenie Erdősa-Stone a (Rozdzia ly 7.1 i 7.5 podre cznika) Jednym z g lównych zagadnień ekstremalnej teorii grafów jest wyznaczenie parametru ex(n, H) = max{
warunek (tzn. macierz M musi być stochastyczna): dla każdego k Q mamy
Wst ep do obliczeniowej biologii molekularnej (J. Tiuryn, wykĺad nr.11, 18 stycznia 2006) Spis treści 7 Ukryte modele arkowa 75 7.1 Algorytm Viterbiego....................... 77 7.2 Prawdopodobieństwo
Procesy Stochastyczne - Zestaw 1
Procesy Stochastyczne - Zestaw 1 Zadanie 1 Niech ξ i η bed a niezależnymi zmiennymi losowymi o rozk ladach N (0, 1). Niech X = ξ +η i Y = ξ η. Znaleźć rozk lad (X, Y ) i rozk lad warunkowy L X ( Y ). Zadanie
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Spacery losowe generowanie realizacji procesu losowego
Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z
Wyk lad 6 Podprzestrzenie przestrzeni liniowych
Wyk lad 6 Podprzestrzenie przestrzeni liniowych 1 Określenie podprzestrzeni Definicja 6.1. Niepusty podzbiór V 1 V nazywamy podprzestrzeni przestrzeni liniowej V, jeśli ma on nastepuj ace w lasności: (I)
Wyk lad 3 Wielomiany i u lamki proste
Wyk lad 3 Wielomiany i u lamki proste 1 Konstrukcja pierścienia wielomianów Niech P bedzie dowolnym pierścieniem, w którym 0 1. Oznaczmy przez P [x] zbiór wszystkich nieskończonych ciagów o wszystkich
Zagadnienie Dualne Zadania Programowania Liniowego. Seminarium Szkoleniowe Edyta Mrówka
Zagadnienie Dualne Zadania Programowania Liniowego Seminarium Szkoleniowe Edyta Mrówka Ogólne zagadnienie PL Znajdź taki wektor X = (x 1, x 2,..., x n ), który minimalizuje kombinacje liniow a przy ograniczeniach
Dopasowywanie sekwencji (ang. sequence alignment) Metody dopasowywania sekwencji. Homologia a podobieństwo sekwencji. Rodzaje dopasowania
Wprowadzenie do Informatyki Biomedycznej Wykład 2: Metody dopasowywania sekwencji Wydział Informatyki PB Dopasowywanie sekwencji (ang. sequence alignment) Dopasowywanie (przyrównywanie) sekwencji polega
Wyk lad 9 Przekszta lcenia liniowe i ich zastosowania
Wyk lad 9 Przekszta lcenia liniowe i ich zastosowania 1 Przekszta lcenia liniowe i ich w lasności Definicja 9.1. Niech V i W bed przestrzeniami liniowymi. Przekszta lcenie f : V W spe lniajace warunki:
STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1
1 STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1 Klasyczny Rachunek Prawdopodobieństwa. 1. Pojȩcia wstȩpne. Doświadczeniem losowym nazywamy doświadczenie, którego wynik nie jest znany. Posiadamy
Teoria miary WPPT IIr. semestr zimowy 2009 Wyk lady 6 i 7. Mierzalność w sensie Carathéodory ego Miara Lebesgue a na prostej
Teoria miary WPPT IIr. semestr zimowy 2009 Wyk lady 6 i 7. Mierzalność w sensie Carathéodory ego Miara Lebesgue a na prostej 27-28/10/09 ZBIORY MIERZALNE WZGLȨDEM MIARY ZEWNȨTRZNEJ Niech µ bȩdzie miar
STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA
1 STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA 1. Pojȩcia wstȩpne. Doświadczeniem losowym nazywamy doświadczenie, którego wynik nie jest znany.
Rachunek zdań - semantyka. Wartościowanie. ezyków formalnych. Semantyka j. Logika obliczeniowa. Joanna Józefowska. Poznań, rok akademicki 2009/2010
Logika obliczeniowa Instytut Informatyki Poznań, rok akademicki 2009/2010 1 formu l rachunku zdań Wartościowanie i sta le logiczne Logiczna równoważność 2 Model formu ly Formu la spe lniona Formu la spe
Statystyka w analizie i planowaniu eksperymentu
19 kwietnia 2011 Testy dla dwóch grup 1 Analiza danych dla dwóch grup: test t-studenta dla dwóch grup sparowanych; test t-studenta dla dwóch grup niezależnych (jednakowe wariancje) test Z dla dwóch grup
Wyk lad 9 Baza i wymiar przestrzeni liniowej
Wyk lad 9 Baza i wymiar liniowej Baza liniowej Niech V bedzie nad cia lem K Powiemy, że zbiór wektorów {α,, α n } jest baza V, jeżeli wektory α,, α n sa liniowo niezależne oraz generuja V tzn V = L(α,,
Statystyka w analizie i planowaniu eksperymentu
21 marca 2011 Zmienna losowa - wst ep Przeprowadzane w praktyce badania i eksperymenty maja bardzo różnorodny charakter, niemniej jednak wiaż a sie one z rejestracja jakiś sygna lów (danych). Moga to być
Indeks odwzorowania zmiennej zespolonej wzgl. krzywej zamknietej
Indeks odwzorowania zmiennej zespolonej wzgl edem krzywej zamkni etej 1. Liczby zespolone - konstrukcja Hamiltona 2. Homotopia odwzorowań na okr egu 3. Indeks odwzorowania ciag lego wzgledem krzywej zamknietej
Statystyka w analizie i planowaniu eksperymentu
23 kwietnia 2014 Korelacja - wspó lczynnik korelacji 1 Gdy badamy różnego rodzaju rodzaju zjawiska (np. przyrodnicze) możemy stwierdzić, że na każde z nich ma wp lyw dzia lanie innych czynników; Korelacja
Wyk lad 4 Warstwy, dzielniki normalne
Wyk lad 4 Warstwy, dzielniki normalne 1 Warstwy grupy wzgl edem podgrupy Niech H bedzie podgrupa grupy (G,, e). W zbiorze G wprowadzamy relacje l oraz r przyjmujac, że dla dowolnych a, b G: a l b a 1 b
Rozdzia l 11. Przestrzenie Euklidesowe Definicja, iloczyn skalarny i norma. iloczynem skalarnym.
Rozdzia l 11 Przestrzenie Euklidesowe 11.1 Definicja, iloczyn skalarny i norma Definicja 11.1 Przestrzenia Euklidesowa nazywamy par e { X K,ϕ }, gdzie X K jest przestrzenia liniowa nad K, a ϕ forma dwuliniowa
Statystyka w analizie i planowaniu eksperymentu
10 marca 2014 Zmienna losowa - wst ep Przeprowadzane w praktyce badania i eksperymenty maja bardzo różnorodny charakter, niemniej jednak wiaż a sie one z rejestracja jakiś sygna lów (danych). Moga to być
Wyk lad 1 Podstawowe struktury algebraiczne
Wyk lad 1 Podstawowe struktury algebraiczne 1 Dzia lanie w zbiorze Majac dane dowolne dwa przedmioty a b możemy z nich utworzyć pare uporzadkowan a (a b) o poprzedniku a i nastepniku b. Warunek na równość
Metoda Simplex bez użycia tabel simplex 29 kwietnia 2010
R. Rȩbowski 1 WPROWADZENIE Metoda Simplex bez użycia tabel simplex 29 kwietnia 2010 1 Wprowadzenie Powszechnie uważa siȩ, że metoda simplex, jako uniwersalny algorytm pozwalaj acyznaleźć rozwi azanie optymalne
Bioinformatyka Laboratorium, 30h. Michał Bereta
Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Wyszukiwanie sekwencji Jak wyszukad z baz danych bioinformatycznych sekwencje podobne do sekwencji zadanej (ang. query
Analiza zrekonstruowanych śladów w danych pp 13 TeV
Analiza zrekonstruowanych śladów w danych pp 13 TeV Odtwarzanie rozk ladów za pomoc a danych Monte Carlo Jakub Cholewiński, pod opiek a dr hab. Krzysztofa Woźniaka 31 lipca 2015 r. Jakub Cholewiński, pod
Statystyczna analiza danych
Statystyczna analiza danych ukryte modele Markowa, zastosowania Anna Gambin Instytut Informatyki Uniwersytet Warszawski plan na dziś Ukryte modele Markowa w praktyce modelowania rodzin białek multiuliniowienia
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów
Statystyka w analizie i planowaniu eksperymentu
21 marca 2011 Zmienna losowa wst ep Przeprowadzane w praktyce badania i eksperymenty maja bardzo różnorodny charakter, niemniej jednak wiaż a sie z rejestracja jakiś sygna lów (danych). Moga to być na
Optymalizacja Rozpoczniemy od przedstawienia kilku charakterystycznych przyk ladów zadań optymalizacji liniowej.
Optymalizacja Rozpoczniemy od przedstawienia kilku charakterystycznych przyk ladów zadań optymalizacji liniowej. Zagadnienie diety. Jak wymieszać wymieszać pszenice, soje i maczk e rybna by uzyskać najtańsza
Wyk lad 12. (ii) najstarszy wspó lczynnik wielomianu f jest elementem odwracalnym w P. Dowód. Niech st(f) = n i niech a bedzie
1 Dzielenie wielomianów Wyk lad 12 Ważne pierścienie Definicja 12.1. Niech P bedzie pierścieniem, który może nie być dziedzina ca lkowitości. Powiemy, że w pierścieniu P [x] jest wykonalne dzielenie z
5. Rozwiązywanie układów równań liniowych
5. Rozwiązywanie układów równań liniowych Wprowadzenie (5.1) Układ n równań z n niewiadomymi: a 11 +a 12 x 2 +...+a 1n x n =a 10, a 21 +a 22 x 2 +...+a 2n x n =a 20,..., a n1 +a n2 x 2 +...+a nn x n =a
ep do matematyki aktuarialnej Micha l Jasiczak Wyk lad 3 Tablice trwania życia 2
Wst ep do matematyki aktuarialnej Micha l Jasiczak Wyk lad 3 Tablice trwania życia 2 1 Przypomnienie Jesteśmy już w stanie wyznaczyć tp x = l x+t l x, gdzie l x, l x+t, to liczebności kohorty odpowiednio
Zaawansowane metody numeryczne
Wykład 11 Ogólna postać metody iteracyjnej Definicja 11.1. (metoda iteracyjna rozwiązywania układów równań) Metodą iteracyjną rozwiązywania { układów równań liniowych nazywamy ciąg wektorów zdefiniowany
Testowanie hipotez statystycznych
round Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 13 grudnia 2014 Plan zajeć 1 Rozk lad estymatora b Rozk lad sumy kwadratów reszt 2 Hipotezy proste - test t Badanie
Arytmetyka. Działania na liczbach, potęga, pierwiastek, logarytm
Arytmetyka Działania na liczbach, potęga, pierwiastek, logarytm Zbiory liczbowe Zbiór liczb naturalnych N = {1,2,3,4, }. Zbiór liczb całkowitych Z = {, 3, 2, 1,0,1,2,3, }. Zbiory liczbowe Zbiór liczb wymiernych
Wyk lad 14 Formy kwadratowe I
Wyk lad 14 Formy kwadratowe I Wielomian n-zmiennych x 1,, x n postaci n a ij x i x j, (1) gdzie a ij R oraz a ij = a ji dla wszystkich i, j = 1,, n nazywamy forma kwadratowa n-zmiennych Forme (1) można
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Wyk lad 8 Natalia Nehrebecka Stanis law Cichocki 29 listopada 2015 Plan zajeć 1 Rozk lad estymatora b Rozk lad sumy kwadratów reszt 2 Hipotezy proste - test t Badanie
3. Macierze i Układy Równań Liniowych
3. Macierze i Układy Równań Liniowych Rozważamy równanie macierzowe z końcówki ostatniego wykładu ( ) 3 1 X = 4 1 ( ) 2 5 Podstawiając X = ( ) x y i wymnażając, otrzymujemy układ 2 równań liniowych 3x
Jeśli czas działania algorytmu zależy nie tylko od rozmiaru danych wejściowych i przyjmuje różne wartości dla różnych danych o tym samym rozmiarze,
Oznaczenia: Jeśli czas działania algorytmu zależy nie tylko od rozmiaru danych wejściowych i przyjmuje różne wartości dla różnych danych o tym samym rozmiarze, to interesuje nas złożoność obliczeniowa
Wstęp do Techniki Cyfrowej... Teoria automatów
Wstęp do Techniki Cyfrowej... Teoria automatów Alfabety i litery Układ logiczny opisywany jest przez wektory, których wartości reprezentowane są przez ciągi kombinacji zerojedynkowych. Zwiększenie stopnia
Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova
Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova M. Czoków, J. Piersa 2010-12-21 1 Definicja Własności Losowanie z rozkładu dyskretnego 2 3 Łańcuch Markova Definicja Własności Losowanie z rozkładu
Statystyka w analizie i planowaniu eksperymentu
5 marca 2011 Zasady 10 wyk ladów; egzamin pisemny; Literatura 1 A. Lomnicki Wprowadzenie do statystyki dla przyrodników PWN 1999. 2 W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski Rachunek
Metody numeryczne I Równania nieliniowe
Metody numeryczne I Równania nieliniowe Janusz Szwabiński szwabin@ift.uni.wroc.pl Metody numeryczne I (C) 2004 Janusz Szwabiński p.1/66 Równania nieliniowe 1. Równania nieliniowe z pojedynczym pierwiastkiem
Drzewa podstawowe poj
Drzewa podstawowe poj ecia drzewo graf reprezentujacy regularna strukture wskaźnikowa, gdzie każdy element zawiera dwa lub wiecej wskaźników (ponumerowanych) do takich samych elementów; wez ly (albo wierzcho
Dopasowania par sekwencji DNA
Dopasowania par sekwencji DNA Tworzenie uliniowień (dopasowań, tzw. alignmentów ) par sekwencji PSA Pairwise Sequence Alignment Dopasowania globalne i lokalne ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA
Porównywanie i dopasowywanie sekwencji
Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek pojawiła się nowa możliwość śledzenia ewolucji na poziomie molekularnym Ewolucja
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2
Metody teorii gier ALP520 - Wykład z Algorytmów Probabilistycznych p.2 Metody teorii gier Cel: Wyprowadzenie oszacowania dolnego na oczekiwany czas działania dowolnego algorytmu losowego dla danego problemu.
Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania
Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania KOMPUTEROWE SYSTEMY STEROWANIA I WSPOMAGANIA DECYZJI Rozproszone programowanie produkcji z wykorzystaniem
0 + 0 = 0, = 1, = 1, = 0.
5 Kody liniowe Jak już wiemy, w celu przesłania zakodowanego tekstu dzielimy go na bloki i do każdego z bloków dodajemy tak zwane bity sprawdzające. Bity te są w ścisłej zależności z bitami informacyjnymi,
SYSTEM DIAGNOSTYCZNY OPARTY NA LOGICE DOMNIEMAŃ. Ewa Madalińska. na podstawie prac:
SYSTEM DIAGNOSTYCZNY OPARTY NA LOGICE DOMNIEMAŃ Ewa Madalińska na podstawie prac: [1] Lukaszewicz,W. (1988) Considerations on Default Logic: An Alternative Approach. Computational Intelligence, 44[1],
Wstęp do programowania
Wstęp do programowania Programowanie dynamiczne Paweł Daniluk Wydział Fizyki Jesień 2013 P. Daniluk(Wydział Fizyki) WP w. X Jesień 2013 1 / 21 Dziel i zwyciężaj przypomnienie 1 Podział problemu na 2 lub
26 marzec, Łańcuchy Markowa z czasem ciągłym. Procesy Stochastyczne, wykład 7, T. Byczkowski, Procesy Stochastyczne, PPT, Matematyka MAP1136
Procesy Stochastyczne, wykład 7, T. Byczkowski, Procesy Stochastyczne, PPT, Matematyka MAP1136 26 marzec, 212 Łańcuchy z czasem ciągłym S = {, 1,..., }, B S = 2 S, ale T = [, ) lub T = (, ). Gdy S skończone,
Zmienna losowa i jej rozkład Dystrybuanta zmiennej losowej Wartość oczekiwana zmiennej losowej
Zmienna losowa i jej rozkład Dystrybuanta zmiennej losowej Wartość oczekiwana zmiennej losowej c Copyright by Ireneusz Krech ikrech@ap.krakow.pl Instytut Matematyki Uniwersytet Pedagogiczny im. KEN w Krakowie
Temat: Algorytm kompresji plików metodą Huffmana
Temat: Algorytm kompresji plików metodą Huffmana. Wymagania dotyczące kompresji danych Przez M oznaczmy zbiór wszystkich możliwych symboli występujących w pliku (alfabet pliku). Przykład M = 2, gdy plik
F t+ := s>t. F s = F t.
M. Beśka, Całka Stochastyczna, wykład 1 1 1 Wiadomości wstępne 1.1 Przestrzeń probabilistyczna z filtracją Niech (Ω, F, P ) będzie ustaloną przestrzenią probabilistyczną i niech F = {F t } t 0 będzie rodziną
Rozkład Gaussa i test χ2
Rozkład Gaussa jest scharakteryzowany dwoma parametramiwartością oczekiwaną rozkładu μ oraz dyspersją σ: METODA 2 (dokładna) polega na zmianie zmiennych i na obliczeniu pk jako różnicy całek ze standaryzowanego
Jeden przyk lad... czyli dlaczego warto wybrać MIESI.
Jeden przyk lad... czyli dlaczego warto wybrać MIESI. Micha l Ramsza Szko la G lówna Handlowa Micha l Ramsza (Szko la G lówna Handlowa) Jeden przyk lad... czyli dlaczego warto wybrać MIESI. 1 / 13 Dlaczego
Uproszczony dowod twierdzenia Fredricksona-Maiorany
Uproszczony dowod twierdzenia Fredricksona-Maiorany W. Rytter Dla uproszczenia rozważamy tylko teksty binarne. S lowa Lyndona sa zwartymi reprezentacjami liniowymi s lów cyklicznych. Dla s lowa x niech
W. Guzicki Próbna matura, grudzień 2014 r. poziom rozszerzony 1
W. Guzicki Próbna matura, grudzień 01 r. poziom rozszerzony 1 Próbna matura rozszerzona (jesień 01 r.) Zadanie 18 kilka innych rozwiązań Wojciech Guzicki Zadanie 18. Okno na poddaszu ma mieć kształt trapezu
Reprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów
Wykład 2. Reprezentacja komputerowa grafów 1 / 69 Macierz incydencji Niech graf G będzie grafem nieskierowanym bez pętli o n wierzchołkach (x 1, x 2,..., x n) i m krawędziach (e 1, e 2,..., e m). 2 / 69
Grzegorz Mazur. Zak lad Metod Obliczeniowych Chemii UJ. 14 marca 2007
Zak lad Metod Obliczeniowych Chemii UJ 14 marca 2007 Rzad 1 Zamiast wst epu 2 Rzad Notacja dużego O Notacja Ω Notacja Θ 3 S lowniczek Rzad Algorytm W matematyce oraz informatyce to skończony, uporzadkowany
Postać Jordana macierzy
Rozdział 8 Postać Jordana macierzy Niech F = R lub F = C Macierz J r λ) F r r postaci λ 1 0 0 0 λ 1 J r λ) = 0 λ 1 0 0 λ gdzie λ F nazywamy klatką Jordana stopnia r Oczywiście J 1 λ) = [λ Definicja 81
Wyk lad 11 Przekszta lcenia liniowe a macierze
Wyk lad 11 Przekszta lcenia liniowe a macierze 1 Izomorfizm przestrzeni L(V ; W ) i M m n (R) Twierdzenie 111 Niech V i W bed a przestrzeniami liniowymi o bazach uporzadkowanych (α 1,, α n ) i (β 1,, β
Macierze. Rozdział Działania na macierzach
Rozdział 5 Macierze Funkcję, która każdej parze liczb naturalnych (i, j) (i 1,..., n; j 1,..., m) przyporządkowuje dokładnie jedną liczbę a ij F, gdzie F R lub F C, nazywamy macierzą (rzeczywistą, gdy
Plan wyk ladu. Kodowanie informacji. Systemy addytywne. Definicja i klasyfikacja. Systemy liczbowe. prof. dr hab. inż.
Plan wyk ladu Systemy liczbowe Poznań, rok akademicki 2008/2009 1 Plan wyk ladu 2 Systemy liczbowe Systemy liczbowe Systemy pozycyjno-wagowe y 3 Przeliczanie liczb Algorytm Hornera Rozwini ecie liczby
Algorytmy sztucznej inteligencji
www.math.uni.lodz.pl/ radmat Przeszukiwanie z ograniczeniami Zagadnienie przeszukiwania z ograniczeniami stanowi grupę problemów przeszukiwania w przestrzeni stanów, które składa się ze: 1 skończonego
Rozwiązywanie układów równań liniowych
Rozwiązywanie układów równań liniowych Marcin Orchel 1 Wstęp Jeśli znamy macierz odwrotną A 1, to możęmy znaleźć rozwiązanie układu Ax = b w wyniku mnożenia x = A 1 b (1) 1.1 Metoda eliminacji Gaussa Pierwszy
Prawa wielkich liczb, centralne twierdzenia graniczne
, centralne twierdzenia graniczne Katedra matematyki i ekonomii matematycznej 17 maja 2012, centralne twierdzenia graniczne Rodzaje zbieżności ciągów zmiennych losowych, centralne twierdzenia graniczne
19 marzec, Łańcuchy Markowa z czasem dyskretnym. Procesy Stochastyczne, wykład 6, T. Byczkowski, Procesy Stochastyczne, PPT, Matematyka MAP1136
Procesy Stochastyczne, wykład 6, T. Byczkowski, Procesy Stochastyczne, PPT, Matematyka MAP1136 19 marzec, 2012 Przykłady procesów Markowa (i). P = (p ij ) - macierz stochastyczna, tzn. p ij 0, j p ij =
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Sterowalność liniowych uk ladów sterowania
Sterowalność liniowych uk ladów sterowania W zadaniach sterowania docelowego należy przeprowadzić obiekt opisywany za pomoc a równania stanu z zadanego stanu pocz atkowego ẋ(t) = f(x(t), u(t), t), t [t,
Zaawansowane metody numeryczne
Wykład 10 Rozkład LU i rozwiązywanie układów równań liniowych Niech będzie dany układ równań liniowych postaci Ax = b Załóżmy, że istnieją macierze L (trójkątna dolna) i U (trójkątna górna), takie że macierz
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów