autoreferat rozprawy doktorskiej Szymon Nowakowski Maj, 2006
|
|
- Ignacy Mirosław Michalak
- 7 lat temu
- Przeglądów:
Transkrypt
1 Estymatory rozkładów prawdopodobieństwa wystȩpowania sekwencji aminokwasowej w uliniowieniu i ich zastosowanie do predykcji struktury trójwymiarowej białek autoreferat rozprawy doktorskiej Szymon Nowakowski Maj, Wst ep Niniejsza rozprawa doktorska zajmuje sie tematyka leżac a na pograniczu trzech dziedzin wiedzy: biologii molekularnej, matematyki oraz informatyki. Sformalizowaliśmy w niej pojecia zwiazane z analiza sekwencyjna białek i DNA. Podajemy szereg matematycznych metod modelowania uliniowień, poruszamy również kwestie analizy jakości tych modeli, a także metod predykcji sekwencji dobrze do uliniowienia dopasowanych. Motywacja dla przedstawionych w rozprawie badań jest zastosowanie prezentowanych wyników do predykcji struktury trójwymiarowej białek. Dr Krzysztof Fidelis zaproponował metode predykcji struktury trójwymiarowej białek z użyciem lokalnych deskryptorów [17]. Omawiane w rozprawie techniki analizy uliniowień sekwencji sa istotna cześci a tej metody. Zagadnienie predykcji struktury białek jest jednym z najważniejszych we współczesnej bioinformatyce, gdyż możliwość znajdowania struktury białek in silico, czyli przy użyciu komputera, mogłaby wspomóc lub nawet wyprzeć niezwykle kosztowne (materialnie i czasowo) metody laboratoryjne, takie jak krystalografia rentgenowska oraz jadrowy rezonans magnetyczny. Poznanie struktury białka jest kluczowym momentem dla wielu badań biologii molekularnej i ma zastosowanie miedzy innymi przy projektowaniu leków, produkcji detergentów i pestycydów, dla analizy funkcji nowych białek. 1
2 Weryfikacji istniejacych technik predykcji struktury trójwymiarowej białek in silico służa przeprowadzane co dwa lata eskperymenty CASP (ang. Critical Assessment of Protein Structure Prediction) [1, 2, 3]. 2 Uliniowienia sekwencyjne i ich opis Uliniowienie można rozumieć jako prostokatn a macierz P o K wierszach i M kolumnach. W klatkach macierzy stoja litery pewnego alfabetu A. W rozprawie zajmujemy sie głównie białkami i wtedy mamy na myśli alfabet dwudziestu liter, bed acych skrótami nazw aminokwasów, czyli A = {A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, Y}. W pewnych rzadkich przypadkach b edziemy mówić o alfabecie DNA, czyli A = {A, C, T, G}. Wiersze macierzy P utożsamiamy z sekwencjami (odpowiednio białkowymi lub DNA). W rozprawie szczegółowo omawiamy stan obecnej wiedzy w dziedzinie estymowania na podstawie uliniowienia rozkładu prawdopodobieństwa określonego na przestrzeni sekwencji o ustalonej długości M. Rozkład estymuje sie na podstawie uliniowienia traktowanego jako próba losowa sekwencji o długości M. Obecnie podstawowym sposobem opisu uliniowień jest rozkład prawdopodobieństwa zwany PSSM (ang. Position Specific Score Matrix), w którym zakłada sie niezależność kolumn uliniowienia. Jednakże w ostatnich latach pojawił sie szereg prac [4, 5, 8, 16, 13, 15], w których analizowane sa zależności, mogace pojawić sie miedzy kolumnami uliniowień. W klasie rozkładów PSSM wiadomo, że najprostszy estymator (najwiekszej wiarogodności, NW) czestości wystepowania liter A w kolumnach uliniowienia nie jest wystarczajacy. Dla krótkich uliniowień może sie bowiem zdarzyć, że jedna z liter w ogóle nie wystapi w badanej kolumnie, czyli wyestymowana czestość wyniesie 0. Jest to niedopuszczalne w zastosowaniach biologicznych, w których staramy sie unikać kategorycznych sadów, że coś nie jest możliwe (szczególnie dla mało licznych prób losowych). Dlatego w użyciu pojawiły sie estymatory bayesowskie, umożliwiajace wyspecyfikowanie wiedzy a priori o spodziewanej czestości wystepowania liter alfabetu A. Do metod tych należa metody zero-offset [14], metoda psuedozliczeń (jeden rozkład Dirichleta jako wiedza a priori) [21], a także metoda oparta na mieszaninie wielu rozkładów Dirichleta [7, 20]. O tej ostatniej pokazano, że jest bliska teoretycznemu optimum w klasie metod PSSM [14]. Innym sposobem unikniecia problemów pojawiajacych sie przy estymacji NW jest użycie macierzy substytucyjnych. Działaja one jednak optymalnie jedynie dla liczby wierszy K = 1 [14]. 2
3 Istnieje szereg metod wprowadzenia zależności miedzy kolumnami do opisu uliniowienia. Można zastosować ukryte modele Markowa (HMM, ang. hidden Markov model) [8], jednakże ten rodzaj opisu modeluje zależności jedynie miedzy przyległymi kolumnami. Do modeli umożliwiajacych analize odległych zależności należa miedzy innymi mieszaniny PSSM, drzewa bayesowskie, a także mieszaniny drzew. Sa to klasy sieci bayesowskich omawiane w kontekście bioinformatycznym w [5]. Inne stosowane metody polegaja na analizie czestości krotek liter [13, 15]. 3 Wyniki teoretyczne 3.1 Zaproponowane nowe metody opisu uliniowień W rozprawie proponujemy nowa metode estymacji PSSM, która jest konkurencyjna do metody mieszaniny rozkładów Dirichleta, ale jest znaczenie szybsza obliczeniowo. Jest ona oparta na zastosowaniu wiedzy a priori w postaci rozkładów Beta. Dowodzimy zgodność szerokiej klasy estymatorów modeli PSSM, miedzy innymi udowodniona jest zgodność estymatora opartego o metode rozkładów Beta. Proponujemy też nowatorska metode wprowadzenia zależności do modelu uliniowienia, która dopuszcza zastosowanie bardziej złożonej wiedzy a priori, niż do tej pory stosowane techniki. Przy metodach uwzgledniaj acych odległe zależności miedzy kolumnami do tej pory stosowano technike pseudozliczeń (jeden rozkład Dirichleta) jako wiedze a priori [5], my zaś podajemy metode estymacji mieszaniny rozkładów PSSM (czyli modelu z zależnościami) z mieszanina wielu rozkładów Dirichleta jako wiedza a priori. Do estymacji parametrów proponowanego modelu stosujemy estymator MAP (ang. Maximum a Posteriori). Używamy w tym celu algorytm EM (ang. Expectation Maximization) [9, 11, 12], służacy do estymacji MAP przy obecności ukrytych zmiennych (miedzy innymi w przypadku mieszanin). Użycie wielu rozkładów Dirichleta jest ważne, gdyż każdy rozkład Dirichleta w mieszaninie może modelować inna fizykochemiczna ceche stowarzyszona z literami alfabetu [7, 20]. W przypadku aminokwasów można mówić o takich ich cechach, jak miedzy innymi hydrofobowość, polarność, ładunek (pozytywny badź ujemny), rozmiar, skłonność do wystepowania w petlach. 3.2 Badanie statystycznej istotności predykcji i jakości modeli W rozprawie poruszamy też temat badania statystycznej istotności predykcji (polegajacych na stwierdzeniu badana sekwencja lub jej fragment dobrze pasuje do badanego uliniowienia ). Predykcje takie były do tej pory badane zazwyczaj przy użyciu p-wartości jako miary ich statystycznej istotności [5]. Wskazujemy 3
4 w rozprawie przyczyny tego, że p-wartość nie jest wystarczajac a miara i w szczególnych przypadkach może źle odpowiadać rzeczywistości. Proponujemy nowa metode, która nazywamy metoda Powtórnej Weryfikacji [19], która na podstawie niezależnej próby pochodzacej z populacji sekwencji negatywnych (na podstawie kryteriów biologicznych do uliniowienia nie pasujacych) oraz pozytywnych (dobrze pasujacych do badanego uliniowienia) pozwala ocenić statystyczna istotność predykcji. Ustalmy badane uliniowienie. Jeśli na niezależnych próbach sekwencji, o których wiadomo, że sa pozytywne (negatywne) wyestymujemy wartości P +, P oraz rozkłady P ( +), P ( ), gdzie P +, P to prawdopodobieństwa a priori tego, że badana sekwencja jest, odpowiednio, pozytywna lub negatywna, zanim zobaczymy sama sekwencje, P ( +), P ( ) to rozkłady badanej oceny predykcji (np. oceny log-odds [10]) otrzymanej przez sekwencje z populacji, odpowiednio, pozytywnej lub negatywnej. Wtedy ocen e Powtórnej Weryfikacji dla wartości oceny predykcji s można sformułować z użyciem twierdzenia Bayesa jako PW(s) = P (+ s) = P (s +)P + P (s +)P + + P (s )P. Kolejna kwestia, która rozważamy w rozprawie, jest ocena jakości modelu dla uliniowienia. Za dobrej jakości uznamy model, w którym dla sekwencji pozytywnych (dobrze pasujacych do badanego uliniowienia) otrzymamy wysokie oceny w sensie Powtórnej Weryfikacji. Jeśli w badanym modelu dla sekwencji, o których wiemy, że sa pozytywne, dostaniemy niskie oceny, to taki model uważamy za słabej jakości. Intuicja ta została sformalizowana w postaci Oczekiwanej Powtórnej Weryfikacji [19] miary zbudowanej na podstawie Powtórnej Weryfikacji (jako wartość oczekiwana Powtórnej Weryfikacji w rozkładzie pozytywnym): OPW = E + (PW) = P 2 (s +)P + ds P (s +)P + + P (s )P. Wiaże ona z modelem probabilistycznym uliniowienia liczbe z przedziału [0, 1], bed ac a ocena jego jakości. 4 Wyniki eksperymentalne Przeprowadziliśmy szereg eskperymentów zarówno na danych syntetycznych, jak i na rzeczywistych biologicznych danych białkowych. Aby ocenić przydatność stosowanych technik również w innych działach bioinformatyki, zbadaliśmy ich użyteczność do analizy sekwencji DNA. 4
5 W przeprowadzonych eksperymentach pokazujemy, że proponowane metody estymacji modelu uliniowienia zachowuja sie zgodnie z naszymi oczekiwaniami. W teście klasyfikacji przeprowadzonym z użyciem weryfikacji krzyżowej metoda rozkładów Beta okazała sie być podobnej skuteczności, co estymator bayesowski używajacy mieszaniny rozkładów Dirichleta jako wiedzy a priori. Czas estymacji w naszej metodzie jest jednakże do 17 razy krótszy [18]. Zaproponowany model uwzgledniaj acy zależności oraz wiedze a priori w postaci mieszaniny rozkładów Dirichleta, w teście klasyfikacji przeprowadzonym z użyciem weryfikacji krzyżowej okazał sie być znacznie skuteczniejszy niż model bez zależności. Było to widoczne szczególnie w przypadku uliniowień zawierajacych wiele sekwencji (czyli macierzy uliniowienia zawierajacej wiele wierszy) [18]. W przypadku liczby sekwencji mniejszej niż 400 (dla uliniowień białkowych) skuteczność estymatora bardzo spada. Jest to zwiazane z faktem, że do wiarygodnej estymacji zależności miedzy kolumnami potrzebne jest wiele przykładów w próbie losowej. Przeprowadziliśmy także szereg eksperymentów polegajacych na poszukiwaniu fragmentów sekwencji testowych dobrze dopasowanych do badanych uliniowień. W eksperymentach tych pokazujemy wyższość Powtórnej Weryfikacji nad innymi metodami predykcji, również nad metoda p-wartość. Omawiane eksperymenty dotycza sekwencji białkowych, jednakże jeden z nich został przeprowadzony na sekwencji DNA [19] i polegał na poszukiwaniu miejsc wiazania czynników transkrypcyjnych. Również w tym eksperymencie pokazana została wyższość metody Powtórnej Weryfikacji. Pokazaliśmy również, jak użyć metody Oczekiwanej Powtórnej Weryfikacji do selekcji najlepszego z kilku możliwych modeli dla danego uliniowienia. W ten sposób powstaje model hybrydowy dla każdego uliniowienia wybierany jest jeden (najlepszy) model, dla przykładu może być to model z zależnościami dla pewnych uliniowień, model PSSM stworzony metoda pseudozliczeń dla innych, dla jeszcze innych uliniowień model PSSM stworzony metoda rozkładów Beta. W przeprowadzonych eksperymentach pokazaliśmy, że predykcja fragmentów sekwencji testowych dobrze dopasowanych do badanych uliniowień z użyciem takiego modelu hybrydowego jest znacznie skuteczniejsza, niż dla modeli czystych oraz niż dla modeli hybrydowych uzyskanych innymi metodami. W rozprawie odnosimy sie również do ostatniego eskperymentu CASP (czyli CASP 6 [3] z 2004 roku). Pokazujemy, jak zachowuje sie metoda lokalnych deskryptorów Fidelisa, jeśli wyposażyć ja w omawiane w rozprawie techniki analizy sekwencyjnej uliniowień białkowych. Porównujemy nasze wyniki z najlepszymi światowymi predykcjami nadesłanymi na CASP i stwierdzamy, że nasze predykcje struktur białkowych sa dość dobrej jakości (w 8 na 23 przypadkach dostajemy predykcje lepsze niż serwer ROBETTA [6], uznawany za wiodacy w tej dziedzinie). 5
6 5 Podsumowanie Wyniki zaprezentowane w rozprawie moga być z powodzeniem użyte jako cześć metody przewidywania struktury trójwymiarowej białek w oparciu o lokalne deskryptory. Dodatkowo pokazujemy ich użycie w innym dziale bioinformatyki, genomice regulatorowej, do wyszukiwania nowych miejsc wiazania czynników transkrypcyjnych. W ramach prac powstały implementacje wszystkich omawianych w rozprawie metod. Ponieważ metoda lokalnych deskryptorów odniosła sukces w porównaniu z innymi metodami, które wzieły udział w ostatnim eksperymencie CASP, planujemy jej zgłoszenie do najnowszego eksperymentu CASP w 2006 roku. Literatura [1] PROTEINS: Structure, Function, and Genetics. Supplement 5, Articles published online in Wiley InterScience, 28 January [2] PROTEINS: Structure, Function, and Genetics. Supplement 6: CASP 5, [3] PROTEINS: Structure, Function, and Bioinformatics. Supplement 7: CASP 6, [4] P. Agarwal and V. Bafna. Detecting non-adjoining correlations within signals in DNA. In RECOMB 98, pages 2 8, [5] Y. Barash, G. Elidan, N. Friedman, and T. Kaplan. Modeling dependencies in protein-dna binding sites. In RECOMB 03, pages 28 37, [6] R. Bonneau, C. E. M. Strauss, C. A. Rohl, D. Chivian, P. Bradley, L. Malmstrom, T. Robertson, and D. Baker. De novo prediction of three-dimensional structures for major protein families. J. Mol. Biol., 322(1):65 78, Sep [7] M. P. Brown, R. Hughey, A. Krogh, I. S. Mian, K. Sjölander, and D. Haussler. Using Dirichlet mixture priors to derive hidden Markov models for protein families. In L. Hunter, D. Searls, and J. Shavlik, editors, ISMB-93, pages 47 55, Menlo Park, CA, AAAI/MIT Press. [8] M. L. Bulyk, P. L. F. Johnson, and G. M. Church. Nucleotides of transcription factor binding sites exert interdependent effects on the binding affinities of transcription factors. Nucl. Acids Res., 30(5): , Mar [9] A. P. Dempster, N. M. Laird, and D. B. Rubin. Maximum likelihood for incomplete data via the EM algorithm. J. Royal Statistical Soc. Series B, 39:1 38, [10] R. Durbin, S. Eddy, A. Krogh, and G. Mitchison. Biological Sequence Analysis. Cambridge University Press, [11] C. Fraley and A. E. Raftery. How many clusters? which clustering method? answers via model-based cluster analysis. The Computer Journal, 41(8): , [12] C. Fraley and A. E. Raftery. Model-based clustering, discriminant analysis, and density estimation. Journal of the American Statistical Association, 97(458): ,
7 [13] N. I. Gershenzon, G. D. Stormo, and I. P. Ioshikhes. Computational technique for improvement of the position-weight matrices for the DNA/protein binding sites. Nucleic Acids Res, 33(7): , Evaluation Studies. [14] K. Karplus. Evaluating regularizers for estimating distributions of amino acids. Proc Int Conf Intell Syst Mol Biol, 3: , [15] U. Keich and P. A. Pevzner. Finding motifs in the twilight zone. In RECOMB 02, pages , [16] O. D. King and F. P. Roth. A non-parametric model for transcription factor binding sites. Nucl. Acids Res., 31(19):e116, Oct Evaluation Studies. [17] A. Kryshtafovych and K. Fidelis. Local descriptors of protein structure. Part I. General approach and classification of local 3D regions in proteins. In preparation. [18] S. Nowakowski, K. Fidelis, and J. Tiuryn. Introducing dependencies into alignments analysis and its use in protein local structure prediction. In R. Wyrzykowski, editor, Proceedings of the Sixth International Conference on Parallel Processing and Applied Mathematics (PPAM 05), LNCS 3911, Springer, pages , [19] S. Nowakowski and J. Tiuryn. A new approach to assessing quality of predictions of transcription factor binding sites. To appear in Journal of Biomedical Informatics. [20] K. Sjölander, K. Karplus, M. Brown, R. Hughey, A. Krogh, I. S. Mian, and D. Haussler. Dirichlet mixtures: a method for improved detection of weak but significant protein sequence homology. Computer Applications in Biosciences, 12: , [21] R. L. Tatusov, S. F. Altschul, and E. V. Koonin. Detection of conserved segments in proteins: Iterative scanning of sequence databases with alignment blocks. PNAS, 91: ,
Modelowanie motywów łańcuchami Markowa wyższego rzędu
Modelowanie motywów łańcuchami Markowa wyższego rzędu Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki 23 października 2008 roku Plan prezentacji 1 Źródła 2 Motywy i ich znaczenie Łańcuchy
Analiza grup i sygnałów używanych do budowy struktury białek z lokalnych deskryptorów
STRESZCZENIE ROZPRAWY DOKTORSKIEJ Analiza grup i sygnałów używanych do budowy struktury białek z lokalnych deskryptorów Michał Drabikowski 1 Wst ep Białka to czasteczki o fundamentalnym znaczeniu dla organizmów
Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak
Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak 1 Wprowadzenie. Zmienne losowe Podczas kursu interesować nas będzie wnioskowanie o rozpatrywanym zjawisku. Poprzez wnioskowanie rozumiemy
Statystyczna analiza danych
Statystyczna analiza danych ukryte modele Markowa, zastosowania Anna Gambin Instytut Informatyki Uniwersytet Warszawski plan na dziś Ukryte modele Markowa w praktyce modelowania rodzin białek multiuliniowienia
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Wykład 10 2008-04-30. Bioinformatyka. Wykład 9. E. Banachowicz. Zakład Biofizyki Molekularnej IF UAM
Bioinformatyka Wykład 9 E. Banachowicz Zakład Biofizyki Molekularnej IF UAM http://www.amu.edu.pl/~ewas 1 Konsekwencje zestawieo wielu sekwencji - rodziny białkowe, domeny, motywy i wzorce 2 Bioinformatyka,
Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych...
Przedmowa... XI Część pierwsza Wprowadzenie i biologiczne bazy danych 1 Wprowadzenie... 3 Czym jest bioinformatyka?... 5 Cele... 5 Zakres zainteresowań... 6 Zastosowania... 7 Ograniczenia... 8 Przyszłe
Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych
Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych Probabilistic Topic Models Jakub M. TOMCZAK Politechnika Wrocławska, Instytut Informatyki 30.03.2011, Wrocław Plan 1. Wstęp
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Bioinformatyka 2 (BT172) Struktura i organizacja kursu
Bioinformatyka 2 (BT172) Wykład 1 Struktura i organizacja kursu dr Krzysztof Murzyn adiunkt w Zakładzie Biofizyki WBtUJ pok. B028, tel. 664-6379 10.X.2005 PODSTAWOWE INFORMACJE 9 godz. wykładów (45 min,
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Jądrowe klasyfikatory liniowe
Jądrowe klasyfikatory liniowe Waldemar Wołyński Wydział Matematyki i Informatyki UAM Poznań Wisła, 9 grudnia 2009 Waldemar Wołyński () Jądrowe klasyfikatory liniowe Wisła, 9 grudnia 2009 1 / 19 Zagadnienie
Bioinformatyka Laboratorium, 30h. Michał Bereta
Bioinformatyka Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl 1 Wyszukiwanie sekwencji Jak wyszukad z baz danych bioinformatycznych sekwencje podobne do sekwencji zadanej (ang. query
Wnioskowanie bayesowskie
Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych Mateusz Kobos, 07.04.2010 Seminarium Metody Inteligencji Obliczeniowej Spis treści Opis algorytmu i zbioru
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Przewidywanie struktury kanału białkowego z wykorzystaniem probabilistycznych gramatyk formalnych oraz modelu ciągłego przepływu jonów
Przewidywanie struktury kanału białkowego z wykorzystaniem probabilistycznych gramatyk formalnych oraz modelu ciągłego przepływu jonów Witold Dyrka Instytut Inżynierii Biomedycznej i Pomiarowej, Politechnika
Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka
Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE Joanna Sawicka Plan prezentacji Model Poissona-Gamma ze składnikiem regresyjnym Konstrukcja optymalnego systemu Bonus- Malus Estymacja
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
Ocena jakości modeli strukturalnych białek w oparciu o podobieństwo strukturalne i semantyczny opis funkcji w ontologii GO
Ocena jakości modeli strukturalnych białek w oparciu o podobieństwo strukturalne i semantyczny opis funkcji w ontologii GO Bogumil Konopka 1, Jean-Christophe Nebel 2, Malgorzata Kotulska 1 * 1 Politechnika
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Rozpoznawanie obrazów
Rozpoznawanie obrazów Ćwiczenia lista zadań nr 5 autorzy: A. Gonczarek, J.M. Tomczak Przykładowe problemy Klasyfikacja binarna Dla obrazu x zaproponowano dwie cechy φ(x) = (φ 1 (x) φ 2 (x)) T. Na obrazie
WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO
Zał. nr 4 do ZW WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYKA STOSOWANA Nazwa w języku angielskim APPLIED STATISTICS Kierunek studiów (jeśli dotyczy): Specjalność
EGZAMIN MAGISTERSKI, 18 września 2013 Biomatematyka
Biomatematyka Liczebność populacji pewnego gatunku jest modelowana przez równanie różnicowe w którym N k stałymi. rn 2 n N n+1 =, A+Nn 2 oznacza liczebność populacji w k tej generacji, a r i A są dodatnimi
RMSD - Ocena jakości wybranych molekularnych struktur przestrzennych
RMSD - Ocena jakości wybranych molekularnych struktur przestrzennych Joanna Wiśniewska Promotor: dr inż. P. Łukasiak Spis treści 1. Zakres pracy magisterskiej 2. Struktura białka 3. Struktura kwasów nukleionowych
Recenzja. Warszawa, dnia 22 października 2018 r.
Warszawa, dnia 22 października 2018 r. Dr hab. Sebastian Kmiecik Wydział Chemii, Centrum Nauk Biologiczno-Chemicznych, Uniwersytet Warszawski, Pasteura 1, Warszawa email: sekmi@chem.uw.edu.pl Recenzja
Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka
Wstęp do obsługi biologicznych baz danych i analizy porównawczej białek i genów Katedra Fizjologii i Biotechnologii Roślin Pok. 113 CB jan.jastrzebski@uwm.edu.pl bioinformatyka@gmail.com www.ebiology.net
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2
Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2 Dr hab. inż. Agnieszka Wyłomańska Faculty of Pure and Applied Mathematics Hugo Steinhaus Center Wrocław University of Science and
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Metody probabilistyczne
Metody probabilistyczne 13. Elementy statystki matematycznej I Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 17.01.2019 1 / 30 Zagadnienia statystki Przeprowadzamy
Podstawowe modele probabilistyczne
Wrocław University of Technology Podstawowe modele probabilistyczne Maciej Zięba maciej.zieba@pwr.edu.pl Rozpoznawanie Obrazów, Lato 2018/2019 Pojęcie prawdopodobieństwa Prawdopodobieństwo reprezentuje
Rozpoznawanie obrazów
Rozpoznawanie obrazów Ćwiczenia lista zadań nr 7 autorzy: A. Gonczarek, J.M. Tomczak Przykładowe problemy Klasyfikacja binarna Dla obrazu x zaproponowano dwie cechy φ(x) = (φ 1 (x) φ 2 (x)) T. Na obrazie
1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
STATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
Genomika Porównawcza. Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski
Genomika Porównawcza Agnieszka Rakowska Instytut Informatyki i Matematyki Komputerowej Uniwersytet Jagiellooski 1 Plan prezentacji 1. Rodzaje i budowa drzew filogenetycznych 2. Metody ukorzeniania drzewa
Wprowadzenie. Data Science Uczenie się pod nadzorem
Wprowadzenie Wprowadzenie Wprowadzenie Wprowadzenie Machine Learning Mind Map Historia Wstęp lub uczenie się z przykładów jest procesem budowy, na bazie dostępnych danych wejściowych X i oraz wyjściowych
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Recenzja rozprawy doktorskiej mgr Mirona Bartosza Kursy p/t. Robust and Efficient Approach to Feature Selection and Machine Learning
Warszawa, 30.01.2017 Prof. Dr hab. Henryk Rybinski Instytut Informatyki Politechniki Warszawskiej hrb@ii.pw.edu.pl Recenzja rozprawy doktorskiej mgr Mirona Bartosza Kursy p/t. Robust and Efficient Approach
BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański
BIOINFORMATYKA edycja 2016 / 2017 wykład 11 RNA dr Jacek Śmietański jacek.smietanski@ii.uj.edu.pl http://jaceksmietanski.net Plan wykładu 1. Rola i rodzaje RNA 2. Oddziaływania wewnątrzcząsteczkowe i struktury
Wykład Ćwiczenia Laboratorium Projekt Seminarium Liczba godzin zajęć zorganizowanych w
WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU Nazwa w języku polskim: Analiza danych ankietowych Nazwa w języku angielskim: Categorical Data Analysis Kierunek studiów (jeśli dotyczy): Matematyka stosowana Specjalność
Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych
Jacek Batóg Uniwersytet Szczeciński Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych Agregacja wyników uzyskiwanych w odrębnych badaniach, często również przy pomocy
Wstęp do Biologii Obliczeniowej
Wstęp do Biologii Obliczeniowej Zagadnienia na kolokwium Bartek Wilczyński 5. czerwca 2018 Sekwencje DNA i grafy Sekwencje w biologii, DNA, RNA, białka, alfabety, transkrypcja DNA RNA, translacja RNA białko,
SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization
Wrocław University of Technology SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization Jakub M. Tomczak Studenckie Koło Naukowe Estymator jakub.tomczak@pwr.wroc.pl 4.1.213 Klasteryzacja Zmienne
Quick Launch Manual:
egresja Odds atio Quick Launch Manual: regresja logistyczna i odds ratio Uniwesytet Warszawski, Matematyka 28.10.2009 Plan prezentacji egresja Odds atio 1 2 egresja egresja logistyczna 3 Odds atio 4 5
WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI
WYDZIAŁ GEOINŻYNIERII, GÓRNICTWA I GEOLOGII KARTA PRZEDMIOTU Nazwa w języku polskim: Statystyka matematyczna Nazwa w języku angielskim: Mathematical Statistics Kierunek studiów (jeśli dotyczy): Górnictwo
Bioinformatyka wykład 10.I.2008
Bioinformatyka wykład 10.I.2008 Przewidywanie struktur białek krzysztof_pawlowski@sggw.pl 2008-01-10 1 Plan wykładu pole siłowe - opis energetyczny struktur białka proces zwijania się białek przewidywanie
STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010
STATYSTYKA MATEMATYCZNA WYKŁAD 14 18 stycznia 2010 Model statystyczny ROZKŁAD DWUMIANOWY ( ) {0, 1,, n}, {P θ, θ (0, 1)}, n ustalone P θ {K = k} = ( ) n θ k (1 θ) n k, k k = 0, 1,, n Geneza: Rozkład Bernoulliego
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
Model Poissona-Nernsta-Plancka w predykcji struktury kanałów białkowych
Model Poissona-Nernsta-Plancka w predykcji struktury kanałów białkowych mgr inż. Witold Dyrka Opiekun: dr hab. inż. Małgorzata Kotulska Instytut Inżynierii Biomedycznej i Pomiarowej Plan wystąpienia Nanopory
Epigenome - 'above the genome'
e - 'above the genome' Wydziaª Matematyki i Informatyki UJ Instytut Informatyki 14 stycznia 2013 e Rysunek: ¹ródªo: http://learn.genetics.utah.edu/content/epigenetics/nutrition/ e Plan Genom 1 Genom e
MODELOWANIE STOCHASTYCZNE CZĘŚĆ II - ŁAŃCUCHY MARKOWA. Biomatematyka Dr Wioleta Drobik-Czwarno
MODELOWANIE STOCHASTYCZNE CZĘŚĆ II - ŁAŃCUCHY MARKOWA Biomatematyka Dr Wioleta Drobik-Czwarno Polecane Łańcuchy Markowa wizualnie: http://setosa.io/ev/markov-chains/ Procesy stochastyczne Procesem stochastycznym
Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.
Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie
Selekcja modelu liniowego i predykcja metodami losowych podprzestrzeni
Selekcja modelu liniowego i predykcja metodami losowych podprzestrzeni Paweł Teisseyre Instytut Podstaw Informatyki, Polska Akademia Nauk Paweł Teisseyre Selekcja modelu liniowego i predykcja 1 / 29 Plan
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
W4 Eksperyment niezawodnościowy
W4 Eksperyment niezawodnościowy Henryk Maciejewski Jacek Jarnicki Jarosław Sugier www.zsk.iiar.pwr.edu.pl Badania niezawodnościowe i analiza statystyczna wyników 1. Co to są badania niezawodnościowe i
Wprowadzenie W ostatnich latach metody mikroekonometryczne zdobywają coraz większą popularność i uznanie badaczy. Jest to związane przede wszystkim z rozwojem technik gromadzenia i przetwarzania danych.
Bioinformatyka wykład 10
Bioinformatyka wykład 10 21.XII.2010 białkowa bioinformatyka strukturalna, c.d. krzysztof_pawlowski@sggw.pl 2011-01-17 1 Regiony nieuporządkowane disordered regions trudna definicja trudne do przewidzenia
EWOLUCYJNE METODY UCZENIA UKRYTYCH MODELI MARKOWA
ZESZYTY NAUKOWE 63-74 Ewa FIGIELSKA 1 EWOLUCYJNE METODY UCZENIA UKRYTYCH MODELI MARKOWA Streszczenie Ukryte modele Markowa stanowią narzędzie modelowania statystycznego wykorzystywane do analizy i przewidywania
Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Michał Kozielski Łukasz Warchał. Instytut Informatyki, Politechnika Śląska
Michał Kozielski Łukasz Warchał Instytut Informatyki, Politechnika Śląska Algorytm DBSCAN Algorytm OPTICS Analiza gęstego sąsiedztwa w grafie Wstępne eksperymenty Podsumowanie Algorytm DBSCAN Analiza gęstości
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Modelowanie interakcji helis transmembranowych
Modelowanie interakcji helis transmembranowych Witold Dyrka, Jean-Christophe Nebel, Małgorzata Kotulska Instytut Inżynierii Biomedycznej i Pomiarowej, Politechnika Wrocławska Faculty of Computing, Information
Ekonometryczne modele nieliniowe
Ekonometryczne modele nieliniowe Wykład 10 Modele przełącznikowe Markowa Literatura P.H.Franses, D. van Dijk (2000) Non-linear time series models in empirical finance, Cambridge University Press. R. Breuning,
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Ćwiczenia lista zadań nr 3 Metody estymacji. Estymator największej wiarygodności Zad. 1 Pojawianie się spamu opisane jest zmienną losową y o rozkładzie zero-jedynkowym
KARTA PRZEDMIOTU. (pieczęć wydziału)
(pieczęć wydziału) KARTA PRZEDMIOTU 1. Nazwa przedmiotu: Eksploracja danych w bioinformatyce 2. Kod przedmiotu: EksDaBio 3. Karta przedmiotu ważna od roku akademickiego: 2017/2018 4. Forma kształcenia:
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (estymacja punktowa, przedziałowa)
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Algorytmy klasyfikacji
Algorytmy klasyfikacji Konrad Miziński Instytut Informatyki Politechnika Warszawska 6 maja 2015 1 Wnioskowanie 2 Klasyfikacja Zastosowania 3 Drzewa decyzyjne Budowa Ocena jakości Przycinanie 4 Lasy losowe
Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji
Wydawnictwo UR 2016 ISSN 2080-9069 ISSN 2450-9221 online Edukacja Technika Informatyka nr 4/18/2016 www.eti.rzeszow.pl DOI: 10.15584/eti.2016.4.48 WIESŁAWA MALSKA Wykorzystanie testu Levene a i testu Browna-Forsythe
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE
UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561
Klasteryzacja i klasyfikacja danych spektrometrycznych
Klasteryzacja i klasyfikacja danych spektrometrycznych Współpraca: Janusz Dutkowski, Anna Gambin, Krzysztof Kowalczyk, Joanna Reda, Jerzy Tiuryn, Michał Dadlez z zespołem (IBB PAN) Instytut Informatyki
EGZAMIN DYPLOMOWY, część II, Biomatematyka
Biomatematyka Niech a będzie recesywnym płciowo skojarzonym genem i załóżmy, że proces selekcji uniemożliwia kojarzenie się osobników płci męskiej o genotypie aa. Przyjmijmy, że genotypy AA, Aa i aa występują
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI
PODSTAWY BIOINFORMATYKI WYKŁAD 4 DOPASOWANIE SEKWENCJI DOPASOWANIE SEKWENCJI 1. Dopasowanie sekwencji - definicja 2. Wizualizacja dopasowania sekwencji 3. Miary podobieństwa sekwencji 4. Przykłady programów
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Ćwiczenia lista zadań nr 2 autorzy: A. Gonczarek, J.M. Tomczak Metody estymacji Zad. 1 Pojawianie się spamu opisane jest zmienną losową x o rozkładzie dwupunktowym
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Elementy nieprzystające Definicja odrzucania Klasyfikacja
Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11
Modele DSGE Jerzy Mycielski Maj 2008 Jerzy Mycielski () Modele DSGE Maj 2008 1 / 11 Modele DSGE DSGE - Dynamiczne, stochastyczne modele równowagi ogólnej (Dynamic Stochastic General Equilibrium Model)
W analizowanym zbiorze danych występowały sporadyczne (nie przekraczające pięciu brakujących wyników na zmienną), losowe braki danych, które
Raport z Quzi eksperymentu. Efektywności interwencji edukacyjnej Bliżej. Projekt finansowany przez Narodowe Centrum Badań i Rozwoju w ramach Innowacji Społecznych. Badania zostały przeprowadzone w grupie
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
Bioinformatyka 2 (BT172) Progresywne metody wyznaczania MSA: T-coffee
Bioinformatyka 2 (BT172) Wykład 5 Progresywne metody wyznaczania MSA: T-coffee Krzysztof Murzyn 14.XI.2005 PLAN WYKŁADU Ostatnio : definicje, zastosowania MSA, złożoność obliczeniowa algorytmu wyznaczania
NOWY PROGRAM STUDIÓW 2016/2017 SYLABUS PRZEDMIOTU AUTORSKIEGO: Wprowadzenie do teorii ekonometrii. Część A
NOWY PROGRAM STUDIÓW 2016/2017 SYLABUS PRZEDMIOTU AUTORSKIEGO: Autor: 1. Dobromił Serwa 2. Tytuł przedmiotu Sygnatura (będzie nadana, po akceptacji przez Senacką Komisję Programową) Wprowadzenie do teorii
Statystyczna analiza danych (molekularnych) estymacja bayesowska i MLE
Statystyczna analiza danych (molekularnych) estymacja bayesowska i MLE Anna Gambin 0 kwietnia 01 Spis treści 1 Estymacja bayesowska 1 Paradoks więźnia.1 Rozkład a priori.................................
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
KARTA KURSU. Kod Punktacja ECTS* 1
KARTA KURSU Nazwa Nazwa w j. ang. Wprowadzenie do statystyki Introduction to statistics Kod Punktacja ECTS* 1 Koordynator Prof. dr hab. Jerzy Wołek Zespół dydaktyczny Prof. dr hab. Jerzy Wołek doktoranci
Współczesna technika inwersyjna - dokad zmierzamy? Wojciech Dȩbski
Współczesna technika inwersyjna - dokad zmierzamy? Wojciech Dȩbski 24.5.2 Pomiar bezpośredni IGF, 24.5.2 IGF - Pomiar pośredni IGF, 24.5.2 IGF - 2 Interpretacja matematyczna m m + dm m d + dd d = G(m)
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
WYKŁAD 2. Problem regresji - modele liniowe
Wrocław University of Technology WYKŁAD 2 Problem regresji - modele liniowe Maciej Zięba Politechnika Wrocławska Regresja Regresja (ang. Regression): Dysponujemy obserwacjami z odpowiadającymi im wartościami
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
Przyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Przyrównanie sekwencji Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych),
Regresyjne metody łączenia klasyfikatorów
Regresyjne metody łączenia klasyfikatorów Tomasz Górecki, Mirosław Krzyśko Wydział Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza XXXV Konferencja Statystyka Matematyczna Wisła 7-11.12.2009
Kaja Milanowska. Lista publikacji - październik 2012. I. Prace oryginalne (rozdziały w książkach zbiorowych, artykuły w czasopismach):
Kaja Milanowska Lista publikacji - październik 2012 I. Prace oryginalne (rozdziały w książkach zbiorowych, artykuły w czasopismach): 1. Philips A, Milanowska K, Lach G, Boniecki M, Rother K, Bujnicki JM
Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja
PRZYRÓWNANIE SEKWENCJI
http://theta.edu.pl/ Podstawy Bioinformatyki III PRZYRÓWNANIE SEKWENCJI 1 Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych), które posiadają