Wersja pliku: v.10, 13 kwietnia 2019 zmiany: dodany punkt na temat testów do sprawozdania. Biologia, bioinformatyka:
|
|
- Adrian Komorowski
- 4 lat temu
- Przeglądów:
Transkrypt
1 Wersja pliku: v.10, 13 kwietnia 2019 zmiany: dodany punkt na temat testów do sprawozdania Biologia, bioinformatyka: 1. DNA kwas deoksyrybonukleinowy. Zbudowany z 4 rodzajów nukleotydów: adeniny, cytozyny, guaniny, tyniny. a. Informatyczno-matematycznie: DNA: ciąg znaków o długości n zbudowanych na alfabecie DNA = {A, C, G, T}. 2. Komplementarność: w podwójnej helisie DNA po jednej stronie jest A (adenina) a po drugiej T (tynina). Po jednej C (cytozyna) po drugiej G (guanina). Czyli dla łańcucha A T C T T G, łańcuch komplementarny to T A G A A C. 3. Oligonukleotyd krótki, jednoniciowy fragment DNA o długości k, zazwyczaj od kilku do kilkunastu nukleotydów. 4. Macierz hybrydyzacji, mikromacierz, mikrochip spłycając temat: płytka, na której w oddzielnych komórkach znajdują się wielokrotnie sklonowane oligonukleotydy. Na przykład dla k = 3, macierz ta zawiera S = 4 3 = 64 komórki, wszystkie kombinacje oligonukleotydów od AAA do TTT rozdzielone po osobnych komórkach macierzy. 5. SBH (sequencing by hybridization, sekwencjonowanie przez hybrydyzację) znowu skracając temat: sklonowane jednoniciowe DNA jest wrzucane na macierz hybrydyzacji. Pewne komórki macierzy przyczepiają do siebie fragmenty DNA, w idealnej sytuacji: tylko te w których znajdują się komplementarne do nich fragmenty / podłańcuchy. Np. DNA : A T T A G T A T przyczepi się do komórki chipu zawierającej oligonukleotyd A A T C A, ponieważ AATCA (na płytce) jest komplementarnym łańcuchem do podłańcucha TTAGT (w wejściowym DNA). 6. SBH wersja klasyczna z błędami, przede wszystkim (tj. domyślnie dla algorytmu) negatywnymi wynikającymi z powtórzeń (pewnych podłańcuchów w łańcuchu DNA, na co w ogólności nie mam wpływu - one po prostu są i będą). Np. we fragmencie ATCTTAGTCT i k=3 powtarza się fragment TCT na dwóch różnych pozycjach. Im dłuższe DNA (n) i im mniejsze k (długość oligonukleotydów użytych w macierzy hybrydyzacji w SBH) tym więcej tego typu powtórzeń będzie się zdarzać. Nawet w najbardziej podstawowej wersji algorytm sekwencjonujący DNA na postawie informacji
2 z macierzy/spektrum (patrz punkt niżej) DNA musi sobie z tym poradzić. Dodatkowo błędy hybrydyzacji: a. negatywne - w spektrum brakuje pewnych elementów, które w teorii składają się na prawdziwe, aktualne badane DNA (i nie wynika to z powtórzeń, ale błędnego odczytania komórki chipu, która w teorii przyłączyła DNA, ale w praktyce nie zostało to wykryte w eksperymencie hybrydyzacyjnym); b. błędy pozytywne - spektrum zawiera pewne dodatkowe oligonukleotydy, które jednak nie występują w badanym (sekwencjonowanym) DNA (czyli: badane DNA w teorii nie powinno przyłączyć się do pewnej komórki (reguła komplementarności, pkt 2.), ale z jakichś powodów komórka ta została uwzględniona jako część spektrum DNA). 7. Spektrum DNA - zbiór oligonukleotydów (krótkich jednoniciowych fragmentów DNA) każdy o długości k. Liczność spektrum: S. Elementy spektrum stanowią zbiór danych do budowy grafu (tj. wierzchołków, których zapis na alfabecie DNA = {A, C, G, T} przy okazji determinuje liczbę i wagi łuków między wierzchołkami). 8. Graf ze spektrum DNA: elementy spektrum do wierzchołki. Łuki z wagą oznaczająca ilość nakładających się liter. Np. z wierzchołka ATGT prowadzi łuk o wadze 3 do TGTC, ponieważ fragment TGT się nakłada na siebie (oba wierzchołki tworzą wtedy łańcuch ATGTC. Inny przykład: z wierzchołka TAAAA do AAAAC prowadzą 4 łuki, o wagach: 4 (AAAA), 3 (AAA), 2(AA) oraz 1(A) gdzie w nawiasie jest podany potencjalny nakładający się na siebie podłańcuch obu wierzchołków (odpowiedni: podłańcuch końcowy dla TAAAA oraz początkowy dla AAAAC). Maksymalna waga łuków, czyli nałożenie na k-1 literach alfabetu DNA jest możliwa do stosowania tylko w przypadku gdy brak jakichkolwiek błędów, nawet tych wynikających z powtórzeń. Czyli praktycznie niemal nigdy: potrzebne są więc łuki o mniejszych wagach. 9. Na przykład dla DNA: A T C T G T A łańcuch komplementarny to T A G A C A T. Dla k = 3, spektrum tego DNA zawiera komórki z macierzy hybrydyzacji oznaczone jako TAG, AGA, GAC, ACA, CAT, czyli komplementarne do nich fragmenty wejściowego DNA: ATC, TCT, CTG, TGT, GTA. Idealna wielkość spektrum to S = n k + 1, czyli dla n = 7, k = 3, S = = 5. W takim wypadku widać, że nie ma tutaj żadnych błędów, nawet negatywnych wynikających w powtórzeń. Gdyby takie istniały, to S < n k + 1. W przypadku gdyby były TYLKO błędy pozytywne hybrydyzacji, wtedy S > n k + 1. W obu wypadkach należy odwiedzić odpowiednią liczbę wierzchołków aby zrekonstruować DNA o długości n. a. Jaka to odpowiednia liczba? Przy braku błędów: S, czyli wszystkie ze spektrum.
3 b. Przy błędach negatywnych wynikających z powtórzeń: S czyli wszystkie ze spektrum, przy czym w tym wypadku niektóre wierzchołki odwiedzamy więcej niż raz. Ale wciąż przyjmujemy, że odwiedzamy wszystkie. c. Przy błędach pozytywnych (tylko) : n k + 1 wierzchołków, bo samo spektrum ma więcej elementów: S > n k + 1. d. Przy błędach pozytywnych i negatywnych równocześnie: tyle wierzchołków, aby zrekonstruować DNA o długości n. Niestety przy tak ogólnym sformułowaniu tej liczby, wyniki, czyli uzyskane DNA najbardziej będą odstawać od oryginału. i. Przy czym problem rozwiązań niejednoznacznych, tj. graf może wyprodukować wiele ścieżek będących DNA, i nie wiemy w sumie które z nich to oryginał (gdybyśmy go nie znali) występować może w każdym przypadku. NAWET gdy spektrum jest idealne 10. WAŻNE: zakładamy, że poza wartościami n oraz k, algorytm heurystyczny ZNA początkowy oligonukleotyd, tj. wierzchołek początkowy grafu w którym szukamy odpowiedniej ścieżki mającej odtworzyć poszukiwane DNA. 11. Algorytm który jest nam w stanie (pośrednio) określić % podobieństwa dwóch sekwencji to np. algorytm Needlemana-Wunscha (uściślijmy: jest algorytm globalnego dopasowania sekwencji przede wszystkim, ale to o co nam chodzi też z niego bez problemu można wyciągnąć, tj. procent podobieństwa po prostu jak już nam stworzy dopasowanie, to literka po literce liczymy ile nukleotydów się nakłada na siebie wyjaśnienie będzie na zajęciach ) np. Wunsch.cpp Informacje organizacyjne: 1. Praca w parach, praca jednoosobowa możliwa ale niezalecana z uwagi na ilość pracy do zrobienia. 2. Drugie laboratorium: przygotować ok. 2 stron tekstu na temat algorytmu, który grupa będzie implementować. Rozmowa na zajęciach nie na ocenę, ale bardziej aby od początku wyeliminować błędy w założeniach algorytmu.
4 3. Projekt musi być oddany na 48 godzin przed ostatnim spotkaniem (15.06 sobota i niedziela, czyli do czwartku / piątku (do rana, czyli od ok przed południem - ja to muszę wszystko przeczytać!) poproszę o sprawozdania na maila. 4. Ocena na podstawie projektu i sprawozdania (w którym ważniejszą część mają stanowić testy algorytmu o nich na drugim laboratorium). Rozmowa zaliczeniowa odbędzie się właśnie 15 i Na projekt zaliczeniowy składają się: 1. Program / algorytm heurystyczny (lub metaheurystyczny (dla ambitnych)) - chodzi w skrócie o każdy algorytm inny niż siłowe przeszukiwanie przestrzeni rozwiązań, co dla problemu SBH mija się z celem. a. Preferowane języki: C, C++, Java lub C#. Mniej preferowane: Python (chyba, że ktoś naprawdę chce ) b. Program konsolowy, czyli okna, przyciski i inne (np. w ramach Visual C#) nie są potrzebne. Z drugiej strony musi być jakaś komunikacja z użytkownikiem: poza DNA w pliku tekstowym powinna być możliwość jego wygenerowania na życzenie (parametr: długość n). Algorytm musi wiedzieć też jaka jest wielkość oligonukleotydów (wartość k), oraz ile procent spektrum to błędy (negatywne lub pozytywne). c. Algorytm uwzględniający oba rodzaje błędów na raz w spektrum: negatywne i pozytywne nie jest jako taki obowiązkowy, ale na pewno mile widziany i wyżej oceniany (będzie ) 2. Sprawozdanie z opisem algorytmu oraz wynikami testów, najlepiej w formie wykresów i/lub tabel. Opis poniżej. Testy: 1. Testy dzielimy na dwa rodzaje: algorytmu oraz instancji problemu. Te pierwsze dotyczą testowania (wybranych) parametrów sterujących pracą samego algorytmu, te drugie
5 parametrów testowanego DNA (np. jego długość n, liczba k, procent błędów, informacja jakie to są błędy). 2. Najlepiej zacząć od testów algorytmu. Robimy to tak, że generujemy zbiór instancji testowych które będziemy używać do testowania wybranych parametrów pracy algorytmu poszukującego (heurystyka / metaheurystyka). Np. 50 czy 100 sekwencji DNA o różnej / podobnej długości. a. Testować można czas pracy algorytmu (każdego), np. średnia jakość rozwiązań całego zbioru testowego gdy algorytm na przerobienie każdej sekwencji z tego zbioru ma np. 5sekund, 10s, 15s, 20s, itd. Następnie wyniki wrzucamy na wykres / do tabelki w sprawozdaniu. b. Inne parametry algorytmu (na pewno takie będą), ale to zależy jaki algorytm implementujemy. W ogólności każdy z nich działa z użyciem mechanizmów prawdopodobieństwa / liczb pseudolosowych, tak więc jego działanie nie jest w pełni deterministyczne tym lepiej z punktu widzenia ogromnej liczby potencjalnych testów które można na takim algorytmie (jego parametrach sterujących) wykonywać. 3. Testy instancji (wykonywane dla konkretnych, na stałe przypisanych wartości parametrów algorytmu, które testowaliśmy wcześniej, ale teraz zostawiamy je w spokoju), konkretne przykłady a. Testujemy jakość rozwiązań w zależności od długości DNA (100, 300, 500, 700nt, itd.) b. Jakość rozwiązań w zależności od procentu błędów: i. negatywnych wynikających z powtórzeń ii. negatywnych iii. pozytywnych iv. wszystkich c. Inne: np. sztucznie wygenerowane DNA, gdzie specjalnie wrzucamy liczne długie powtórzenia podobnych podsekwencji, np. wiele liter A obok siebie, do przesady, np. sekwencja TCGTAAAAAAAAAAAAATGCTA będzie problematyczna nawet dla k=10.
Algorytmy kombinatoryczne w bioinformatyce
Algorytmy kombinatoryczne w bioinformatyce wykład 2: sekwencjonowanie cz. 1 prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Poznawanie sekwencji genomowej Poznawanie sekwencji
Bardziej szczegółowoprof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Poznawanie sekwencji genomowej
Bioinformatyka wykład 2: sekwencjonowanie cz. 1 prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Poznawanie sekwencji genomowej Poznawanie sekwencji genomów na trzech poziomach
Bardziej szczegółowoKombinatoryczne aspekty nieklasycznego sekwencjonowania DNA przez hybrydyzację
POLITECHNIKA POZNAŃSKA Wydział Informatyki Instytut Informatyki Kombinatoryczne aspekty nieklasycznego sekwencjonowania DNA przez hybrydyzację Marcin Radom Rozprawa doktorska Promotor: dr hab. inż. Piotr
Bardziej szczegółowoAUTOMATYZACJA PROCESÓW DYSKRETNYCH 2012 ALGORYTM SEKWENCJONOWANIA DNA PRZY UŻYCIU CHIPU BINAR- NEGO DLA WSZYSTKICH TYPÓW BŁEDÓW HYBRYDYZACJI
AUTOMATYZACJA PROCESÓW DYSKRETNYCH 2012 Marcin RADOM, Piotr FORMANOWICZ Politechnika Poznańska ALGORYTM SEKWENCJONOWANIA DNA PRZY UŻYCIU CHIPU BINAR- NEGO DLA WSZYSTKICH TYPÓW BŁEDÓW HYBRYDYZACJI Streszczenie.
Bardziej szczegółowoKombinatoryczna analiza widm 2D-NOESY w spektroskopii Magnetycznego Rezonansu Jądrowego cząsteczek RNA. Marta Szachniuk
Kombinatoryczna analiza widm 2D-NOESY w spektroskopii Magnetycznego Rezonansu Jądrowego cząsteczek RNA Marta Szachniuk Plan prezentacji Wprowadzenie do tematyki badań Teoretyczny model problemu Złożoność
Bardziej szczegółowoGrafy etykietowalne i sieci Petriego w analizie procesów biochemicznych i biologicznych
POLITECHNIKA POZNAŃSKA Wydział Informatyki Instytut Informatyki Grafy etykietowalne i sieci Petriego w analizie procesów biochemicznych i biologicznych Adam Kozak Rozprawa doktorska Promotor: dr hab. inż.
Bardziej szczegółowopaździernika 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II
10 października 2013: Elementarz biologii molekularnej www.bioalgorithms.info Wykład nr 2 BIOINFORMATYKA rok II Komórka: strukturalna i funkcjonalne jednostka organizmu żywego Jądro komórkowe: chroniona
Bardziej szczegółowoZadania laboratoryjne i projektowe - wersja β
Zadania laboratoryjne i projektowe - wersja β 1 Laboratorium Dwa problemy do wyboru (jeden do realizacji). 1. Water Jug Problem, 2. Wieże Hanoi. Water Jug Problem Ograniczenia dla każdej z wersji: pojemniki
Bardziej szczegółowoXQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery
http://xqtav.sourceforge.net XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery dr hab. Jerzy Tyszkiewicz dr Andrzej Kierzek mgr Jacek Sroka Grzegorz Kaczor praca mgr pod
Bardziej szczegółowoDane mikromacierzowe. Mateusz Markowicz Marta Stańska
Dane mikromacierzowe Mateusz Markowicz Marta Stańska Mikromacierz Mikromacierz DNA (ang. DNA microarray) to szklana lub plastikowa płytka (o maksymalnych wymiarach 2,5 cm x 7,5 cm) z naniesionymi w regularnych
Bardziej szczegółowoZastosowanie metod opartych na teorii grafów do rozwiązywania wybranych problemów analizy sekwencji nukleotydowych i aminokwasowych
POLITECHNIKA POZNAŃSKA Wydział Informatyki Instytut Informatyki Zastosowanie metod opartych na teorii grafów do rozwiązywania wybranych problemów analizy sekwencji nukleotydowych i aminokwasowych Tomasz
Bardziej szczegółowoDopasowania par sekwencji DNA
Dopasowania par sekwencji DNA Tworzenie uliniowień (dopasowań, tzw. alignmentów ) par sekwencji PSA Pairwise Sequence Alignment Dopasowania globalne i lokalne ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA
Bardziej szczegółowoStruktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott
Struktury danych i złożoność obliczeniowa Wykład 7 Prof. dr hab. inż. Jan Magott Problemy NP-zupełne Transformacją wielomianową problemu π 2 do problemu π 1 (π 2 π 1 ) jest funkcja f: D π2 D π1 spełniająca
Bardziej szczegółowoTestowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Bardziej szczegółowoGrafy i sieci wybrane zagadnienia wykład 2: modele służące rekonstrukcji sekwencji
Grafy i sieci wybrane zagadnienia wykład 2: modele służące rekonstrukcji sekwencji prof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Plan wykładu. Modele grafowe problemu sekwencjonowania
Bardziej szczegółowoPolitechnika Wrocławska. Dopasowywanie sekwencji Sequence alignment
Dopasowywanie sekwencji Sequence alignment Drzewo filogenetyczne Kserokopiarka zadanie: skopiować 300 stron. Co może pójść źle? 2x ta sama strona Opuszczona strona Nadmiarowa pusta strona Strona do góry
Bardziej szczegółowoPomorski Czarodziej 2016 Zadania. Kategoria C
Pomorski Czarodziej 2016 Zadania. Kategoria C Poniżej znajduje się 5 zadań. Za poprawne rozwiązanie każdego z nich możesz otrzymać 10 punktów. Jeżeli otrzymasz za zadanie maksymalną liczbę punktów, możesz
Bardziej szczegółowoPrzepustowość kanału, odczytywanie wiadomości z kanału, poprawa wydajności kanału.
Przepustowość kanału, odczytywanie wiadomości z kanału, poprawa wydajności kanału Wiktor Miszuris 2 czerwca 2004 Przepustowość kanału Zacznijmy od wprowadzenia równości IA, B HB HB A HA HA B Można ją intuicyjnie
Bardziej szczegółowoWybrane podstawowe rodzaje algorytmów
Wybrane podstawowe rodzaje algorytmów Tomasz Głowacki tglowacki@cs.put.poznan.pl Zajęcia finansowane z projektu "Rozwój i doskonalenie kształcenia na Politechnice Poznańskiej w zakresie technologii informatycznych
Bardziej szczegółowoModele grafowe i algorytmy dla klasycznego problemu sekwencjonowania DNA przez hybrydyzację oraz dla jego odmiany z informacją o powtórzeniach
Politechnika Poznańska Wydział Informatyki Instytut Informatyki Streszczenie rozprawy doktorskiej Modele grafowe i algorytmy dla klasycznego problemu sekwencjonowania DNA przez hybrydyzację oraz dla jego
Bardziej szczegółowoprof. dr hab. inż. Marta Kasprzak Instytut Informatyki, Politechnika Poznańska Dopasowanie sekwencji
Bioinformatyka wykład 5: dopasowanie sekwencji prof. dr hab. inż. Marta Kasprzak Instytut Informatyk Politechnika Poznańska Dopasowanie sekwencji Badanie podobieństwa sekwencji stanowi podstawę wielu gałęzi
Bardziej szczegółowoSOBOTA 28 maja 2011 GRUPA 5 PU GRUPA 6 PU GRUPA 7 PU GRUPA 8 PU 9.00-10.30. przerwa "kawowa" 11.00-12.30 12.45-14.15. przerwa "obiadowa" 15.00-16.
SOBOTA 28 maja 2011 NIEDZIELA 29 maja 2011 B.2.4 Technika wystąpień publicznych B.2.4 Technika wystąpień publicznych B.2.4 Technika wystąpień publicznych B.2.4 Technika wystąpień publicznych B.2.4 Technika
Bardziej szczegółowoI znowu można jak w C, za pomocą starych struktur i metod:
Obsługa plików I znowu można jak w C, za pomocą starych struktur i metod: Odczyt (ifstream) Zapis (ofstream) Czego tu wszędzie brakuje? plik.close(); Wynik Plik testowy.txt app jak append http://www.cplusplus.com/reference/iostream/ifstream/
Bardziej szczegółowoPrzykład planowania sieci publicznego transportu zbiorowego
TRANSPORT PUBLICZNY Przykład planowania sieci publicznego transportu zbiorowego Źródło: Bieńczak M., 2015 Politechnika Poznańska, Wydział Maszyn Roboczych i Transportu 1 METODYKA ZAŁOśENIA Dostarczanie
Bardziej szczegółowoJęzyki formalne i automaty Ćwiczenia 6
Języki formalne i automaty Ćwiczenia 6 Autor: Marcin Orchel Spis treści Spis treści... 1 Wstęp teoretyczny... 2 Wyrażenia regularne... 2 Standardy IEEE POSIX Basic Regular Expressions (BRE) oraz Extended
Bardziej szczegółowoSYSTEMY OPERACYJNE LABORATORIUM 2014/2015
1 SYSTEMY OPERACYJNE LABORATORIUM 2014/2015 ZASADY OCENIANIA ZADAŃ PROGRAMISTYCZNYCH: Zadania laboratoryjne polegają na symulacji i badaniu własności algorytmów/mechanizmów stosowanych w systemach operacyjnych.
Bardziej szczegółowoUkłady stochastyczne
Instytut Informatyki Uniwersytetu Śląskiego 21 stycznia 2009 Definicja Definicja Proces stochastyczny to funkcja losowa, czyli funkcja matematyczna, której wartości leżą w przestrzeni zdarzeń losowych.
Bardziej szczegółowoĆwiczenie: JavaScript Cookies (3x45 minut)
Ćwiczenie: JavaScript Cookies (3x45 minut) Cookies niewielkie porcje danych tekstowych, które mogą być przesyłane między serwerem a przeglądarką. Przeglądarka przechowuje te dane przez określony czas.
Bardziej szczegółowoSpacery losowe generowanie realizacji procesu losowego
Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z
Bardziej szczegółowoTechnologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15
Technologie cyfrowe Artur Kalinowski Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.pl Semestr letni 2014/2015 Zadanie algorytmiczne: wyszukiwanie dane wejściowe:
Bardziej szczegółowoPorównanie algorytmów wyszukiwania najkrótszych ścieżek międz. grafu. Daniel Golubiewski. 22 listopada Instytut Informatyki
Porównanie algorytmów wyszukiwania najkrótszych ścieżek między wierzchołkami grafu. Instytut Informatyki 22 listopada 2015 Algorytm DFS w głąb Algorytm przejścia/przeszukiwania w głąb (ang. Depth First
Bardziej szczegółowoExcel - podstawa teoretyczna do ćwiczeń. 26 lutego 2013
26 lutego 2013 Ćwiczenia 1-2 Częste błędy i problemy: 1 jeżeli użyjemy niewłaściwego znaku dziesiętnego Excel potraktuje liczbę jak tekst - aby uniknać takich sytuacji używaj klawiatury numerycznej, 2
Bardziej szczegółowoAlgorytmy sortujące i wyszukujące
Algorytmy sortujące i wyszukujące Zadaniem algorytmów sortujących jest ułożenie elementów danego zbioru w ściśle określonej kolejności. Najczęściej wykorzystywany jest porządek numeryczny lub leksykograficzny.
Bardziej szczegółowo1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:
Metoda analizy macierzy współczynników korelacji Idea metody sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienną objaśnianą i równocześnie słabo skorelowane
Bardziej szczegółowoZadanie 1: Piętnastka
Informatyka, studia dzienne, inż. I st. semestr VI Sztuczna Inteligencja i Systemy Ekspertowe 2010/2011 Prowadzący: mgr Michał Pryczek piątek, 12:00 Data oddania: Ocena: Grzegorz Graczyk 150875 Marek Rogalski
Bardziej szczegółowoSCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO
SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO. Rzeczywistość (istniejąca lub projektowana).. Model fizyczny. 3. Model matematyczny (optymalizacyjny): a. Zmienne projektowania
Bardziej szczegółowoTestowanie elementów programowalnych w systemie informatycznym
Testowanie elementów programowalnych w systemie informatycznym Marek Żukowicz 10 października 2017 Streszczenie W literaturze istnieje wiele modeli wytwarzania oprogramowania oraz wiele strategii testowania
Bardziej szczegółowoSpecyfikacja przypadków i scenariuszy testowych
Specyfikacja przypadków i scenariuszy testowych wzów przygotowany na podstawie Rozporządzenia Ministra Nauki i Informatyzacji z dnia 19 października 2005r. w sprawie testów akceptacyjnych oraz badania
Bardziej szczegółowoProjekty zaliczeniowe Podstawy Programowania 2012/2013
Projekty zaliczeniowe Podstawy Programowania 2012/2013 0. Zasady ogólne W skład projektu wchodzą następujące elementy: dokładny opis rozwiązywanego problemu opis słowny rozwiązania problemu wraz z pseudokodami
Bardziej szczegółowoKATEDRA INFORMATYKI TECHNICZNEJ. Ćwiczenia laboratoryjne z Logiki Układów Cyfrowych. ćwiczenie 204
Opracował: prof. dr hab. inż. Jan Kazimierczak KATEDA INFOMATYKI TECHNICZNEJ Ćwiczenia laboratoryjne z Logiki Układów Cyfrowych ćwiczenie 204 Temat: Hardware'owa implementacja automatu skończonego pełniącego
Bardziej szczegółowoLaboratorium technik optymalizacji
Laboratorium technik optymalizacji Marek Kubiak 1 Opis zajęć Zakres zajęć laboratoryjnych jest podzielony na 2 części: realizację algorytmu przeszukiwania lokalnego i wizualizacji jego działania dla zadanego
Bardziej szczegółowoBioinformatyka. Program UGENE
Bioinformatyka Program UGENE www.michalbereta.pl UGENE jest darmowym programem do zadań bioinformatycznych. Można go pobrać ze strony http://ugene.net/. 1 1. Wczytanie rekordu z bazy ENA do programu UGENE
Bardziej szczegółowoData Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Bardziej szczegółowoMateriały dla finalistów
Materiały dla finalistów Malachoviacus Informaticus 2016 11 kwietnia 2016 Wprowadzenie Poniższy dokument zawiera opisy zagadnień, które będą niezbędne do rozwiązania zadań w drugim etapie konkursu. Polecamy
Bardziej szczegółowoWstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa
Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa M. Czoków, J. Piersa 2012-01-10 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego 3 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego
Bardziej szczegółowoFunkcje wyszukiwania i adresu PODAJ.POZYCJĘ
Funkcje wyszukiwania i adresu PODAJ.POZYCJĘ Mariusz Jankowski autor strony internetowej poświęconej Excelowi i programowaniu w VBA; Bogdan Gilarski właściciel firmy szkoleniowej Perfect And Practical;
Bardziej szczegółowoImię, nazwisko, nr indeksu
Imię, nazwisko, nr indeksu (kod) (9 punktów) Wybierz 9 z poniższych pytań i wybierz odpowiedź tak/nie (bez uzasadnienia). Za prawidłowe odpowiedzi dajemy +1 punkt, za złe -1 punkt. Punkty policzymy za
Bardziej szczegółowoElementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Bardziej szczegółowoAutomat skończony FSM Finite State Machine
Automat skończony FSM Finite State Machine Projektowanie detektora sekwencji Laboratorium z Elektroniki Współczesnej A. Skoczeń, KOiDC, WFiIS, AGH, 2019 AGH, WFiIS, Elektronika Współczesna 1 Deterministyczny
Bardziej szczegółowoWyŜsza Szkoła Zarządzania Ochroną Pracy MS EXCEL CZ.2
- 1 - MS EXCEL CZ.2 FUNKCJE Program Excel zawiera ok. 200 funkcji, będących predefiniowanymi formułami, słuŝącymi do wykonywania określonych obliczeń. KaŜda funkcja składa się z nazwy funkcji, która określa
Bardziej szczegółowoFunkcje są prawdopodobnie najważniejszą częścią każdego poważnego programu (w każdym języku programowania).
Funkcje w Pythonie Funkcje to części programu wielokrotnego użytku. Pozwalają nam nadad nazwę blokowi wyrażeo, a następnie uruchamiad ten blok używając tej nazwy gdziekolwiek w programie, dowolną ilośd
Bardziej szczegółowoModele grafowe i algorytmy dla klasycznego problemu sekwencjonowania DNA przez hybrydyzację oraz dla jego odmiany z informacją o powtórzeniach
Politechnika Poznańska Wydział Informatyki Instytut Informatyki Rozprawa doktorska Modele grafowe i algorytmy dla klasycznego problemu sekwencjonowania DNA przez hybrydyzację oraz dla jego odmiany z informacją
Bardziej szczegółowoMODELOWANIE RZECZYWISTOŚCI
MODELOWANIE RZECZYWISTOŚCI Daniel Wójcik Instytut Biologii Doświadczalnej PAN d.wojcik@nencki.gov.pl tel. 022 5892 424 http://www.neuroinf.pl/members/danek/swps/ Podręcznik Iwo Białynicki-Birula Iwona
Bardziej szczegółowoWydział Matematyki I Informatyki ul. Słoneczna Olsztyn
Klucz Napisać program sprawdzający czy dany klucz pasuje do danego zamka. Dziurka w zamku reprezentowana jest w postaci tablicy zero-jedynkowej i jest spójna. Klucz zakodowany jest jako ciąg par liczb
Bardziej szczegółowoużytkownika 1 Jak wybrać temat pracy 2 Spis treści 3 Część pierwsza problematyka 4 Część druga stosowane metody 5 Część trzecia propozycja rozwiązania
1 Jak wybrać temat pracy 2 Spis treści 3 Część pierwsza problematyka 4 Część druga stosowane metody 5 Część trzecia propozycja rozwiązania 6 Część czwarta dokumentacja techniczna i dokumentacja użytkownika
Bardziej szczegółowoSekwencjonowanie, przewidywanie genów
Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański Sekwencjonowanie, przewidywanie genów 1. Technologie sekwencjonowania Genomem nazywamy sekwencję
Bardziej szczegółowoPrzewodnik użytkownika (instrukcja) AutoMagicTest
Przewodnik użytkownika (instrukcja) AutoMagicTest 0.1.21.137 1. Wprowadzenie Aplikacja AutoMagicTest to aplikacja wspierająca testerów w testowaniu i kontrolowaniu jakości stron poprzez ich analizę. Aplikacja
Bardziej szczegółowoDokumentacja Końcowa
Metody Sztucznej Inteligencji 2 Projekt Prognozowanie kierunku ruchu indeksów giełdowych na podstawie danych historycznych. Dokumentacja Końcowa Autorzy: Robert Wojciechowski Michał Denkiewicz Wstęp Celem
Bardziej szczegółowoMatematyczne Podstawy Informatyki
Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 2013/2014 Stany równoważne Stany p i q są równoważne,
Bardziej szczegółowoProcenty % % oznacza liczbę 0, 01 czyli / 100
% oznacza liczbę 0, 01 czyli / 100 p p % oznacza iloczyn p 0,01 100 Procenty % Wyrażenie p % liczby x oznacza iloczyn 1 Łacińskie pro cent oznacza na 100 Stosuje się także oznaczający 0,001 Łacińskie pro
Bardziej szczegółowoInstytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów
Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa Diagnostyka i niezawodność robotów Laboratorium nr 6 Model matematyczny elementu naprawialnego Prowadzący: mgr inż. Marcel Luzar Cele ćwiczenia:
Bardziej szczegółowoZadanie projektowe nr 1
Zadanie projektowe nr 1 Badanie efektywności operacji dodawania (wstawiania), usuwania oraz wyszukiwania elementów w podstawowych strukturach danych Należy zaimplementować oraz dokonać pomiaru czasu działania
Bardziej szczegółowoAlgorytmika dla bioinformatyki
Algorytmika dla bioinformatyki kurs 2018/2019 Prof. Danuta Makowiec Instytut Fizyki Teoretycznej i Astrofizyki pok. 353, danuta.makowiec@gmail.com Cele kursu 2 Treści wykładu będą skoncentrowane wokół
Bardziej szczegółowosklep - online Jak przygotować PDF do druku Krótki poradnik jak przygotować plik do druku w programie Corel draw - na przykładzie ulotki A4.
sklep - online drukarnia Jak przygotować PDF do druku Krótki poradnik jak przygotować plik do druku w programie Corel draw - na przykładzie ulotki A4. Przeczytaj! Jeżeli nie posiadasz doświadczenia związanego
Bardziej szczegółowoLaboratorium nr 4: Arytmetyka liczb zespolonych
Laboratorium nr 4: Arytmetyka liczb zespolonych 1 Cel ćwiczenia Wykształcenie umiejętności definiowania przeciążeń operatorów arytmetycznych dwuargumentowych i jednoargumentowych dla własnych struktur
Bardziej szczegółowoDopełnienie to można wyrazić w następujący sposób:
1. (6 punktów) Czy dla każdego regularnego L, język f(l) = {w : każdy prefiks w długości nieparzystej należy do L} też jest regularny? Odpowiedź. Tak, jęsli L jest regularny to też f(l). Niech A będzie
Bardziej szczegółowoWSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19
WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19 Witold Dyrka 14 marca 2019 1 Wprowadzenie 1.1 Definicje bioinformatyki Według polskiej Wikipedii [1], Bioinformatyka interdyscyplinarna dziedzina
Bardziej szczegółowoWykrywanie twarzy na zdjęciach przy pomocy kaskad
Wykrywanie twarzy na zdjęciach przy pomocy kaskad Analiza i przetwarzanie obrazów Sebastian Lipnicki Informatyka Stosowana,WFIIS Spis treści 1. Wstęp... 3 2. Struktura i funkcjonalnośd... 4 3. Wyniki...
Bardziej szczegółowoWprowadzenie: języki, symbole, alfabety, łańcuchy Języki formalne i automaty. Literatura
Wprowadzenie: języki, symbole, alfabety, łańcuchy Języki formalne i automaty Dr inŝ. Janusz Majewski Katedra Informatyki Literatura Aho A. V., Sethi R., Ullman J. D.: Compilers. Principles, Techniques
Bardziej szczegółowoPrzewodnik dla użytkownika do systemu STUDIO
Przewodnik dla użytkownika do systemu STUDIO Projekt egreen JOBS nr. 2013-1-PL1-LEO05-37623 Projekt egreen JOBS nr. 2013-1-PL1-LEO05-37623 Spis treści Flexilab 3 Wstęp 5 Wyjście z systemu 5 Korzystanie
Bardziej szczegółowoSymulacja w przedsiębiorstwie
Symulacja w przedsiębiorstwie Generowanie liczb losowych Cel Celem laboratorium jest zapoznanie się z funkcjami generowania liczb pseudolosowych w środowisku Ms Excel. Funkcje te są podstawą modeli symulacyjnych
Bardziej szczegółowoMetoda tabel semantycznych. Dedukcja drogi Watsonie, dedukcja... Definicja logicznej konsekwencji. Logika obliczeniowa.
Plan Procedura decyzyjna Reguły α i β - algorytm Plan Procedura decyzyjna Reguły α i β - algorytm Logika obliczeniowa Instytut Informatyki 1 Procedura decyzyjna Logiczna konsekwencja Teoria aksjomatyzowalna
Bardziej szczegółowoZadanie 1. Zmiana systemów. Zadanie 2. Szyfr Cezara. Zadanie 3. Czy liczba jest doskonała. Zadanie 4. Rozkład liczby na czynniki pierwsze Zadanie 5.
Zadanie 1. Zmiana systemów. Zadanie 2. Szyfr Cezara. Zadanie 3. Czy liczba jest doskonała. Zadanie 4. Rozkład liczby na czynniki pierwsze Zadanie 5. Schemat Hornera. Wyjaśnienie: Zadanie 1. Pozycyjne reprezentacje
Bardziej szczegółowoOdwrotna analiza wartości brzegowych przy zaokrąglaniu wartości
Odwrotna analiza wartości brzegowych przy zaokrąglaniu wartości W systemach informatycznych istnieje duże prawdopodobieństwo, że oprogramowanie będzie się błędnie zachowywać dla wartości na krawędziach
Bardziej szczegółowoZastosowanie metod opartych na teorii grafów do rozwiązywania wybranych problemów analizy sekwencji nukleotydowych i aminokwasowych
POLITECHNIKA POZNAŃSKA Wydział Informatyki Instytut Informatyki Zastosowanie metod opartych na teorii grafów do rozwiązywania wybranych problemów analizy sekwencji nukleotydowych i aminokwasowych Tomasz
Bardziej szczegółowoTemat: Projektowanie sterownika rozmytego. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE
Temat: Projektowanie sterownika rozmytego Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE Dr inż. Barbara Mrzygłód KISiM, WIMiIP, AGH mrzyglod@ agh.edu.pl 1 Wprowadzenie System
Bardziej szczegółowoDNA - niezwykła cząsteczka. Tuesday, 21 May 2013
DNA - niezwykła cząsteczka Składniki DNA Składniki DNA Nazewnictwo nukleotydów w DNA i RNA Zasada zawsze jest przyłączana wiązaniem N-glikozydowym Ortofosforan może być przyłączony w pozycji 3 lub 5 Struktura
Bardziej szczegółowoAlgorytmy zrandomizowane
Algorytmy zrandomizowane http://zajecia.jakubw.pl/nai ALGORYTMY ZRANDOMIZOWANE Algorytmy, których działanie uzależnione jest od czynników losowych. Algorytmy typu Monte Carlo: dają (po pewnym czasie) wynik
Bardziej szczegółowoCzęść 3 - Konfiguracja
Spis treści Część 3 - Konfiguracja... 3 Konfiguracja kont użytkowników... 4 Konfiguracja pól dodatkowych... 5 Konfiguracja kont email... 6 Konfiguracja szablonów dokumentów... 8 Konfiguracja czynności
Bardziej szczegółowoWykorzystanie algorytmów mrówkowych w dynamicznym problem
Wykorzystanie algorytmów mrówkowych w dynamicznym problemie marszrutyzacji Promotor: dr inż. Aneta Poniszewska-Marańda Współpromotor: mgr inż. Łukasz Chomątek 18 stycznia 2013 Przedmiot i cele pracy dyplomowej
Bardziej szczegółowoKtóre z poniższych adresów są adresem hosta w podsieci o masce 255.255.255.248
Zadanie 1 wspólne Które z poniższych adresów są adresem hosta w podsieci o masce 255.255.255.248 17.61.12.31 17.61.12.93 17.61.12.144 17.61.12.33 17.61.12.56 17.61.12.15 Jak to sprawdzić? ODPOWIEDŹ. Po
Bardziej szczegółowoMetody eksploracji danych Laboratorium 2. Weka + Python + regresja
Metody eksploracji danych Laboratorium 2 Weka + Python + regresja KnowledgeFlow KnowledgeFlow pozwala na zdefiniowanie procesu przetwarzania danych Komponenty realizujące poszczególne czynności można konfigurować,
Bardziej szczegółowoTechnologie Informacyjne
POLITECHNIKA KRAKOWSKA - WIEiK - KATEDRA AUTOMATYKI Technologie Informacyjne www.pk.edu.pl/~zk/ti_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład: Generacja liczb losowych Problem generacji
Bardziej szczegółowoAutostopem przez galaiktykę: Intuicyjne omówienie zagadnień. Tom I: Optymalizacja. Nie panikuj!
Autostopem przez galaiktykę: Intuicyjne omówienie zagadnień Tom I: Optymalizacja Nie panikuj! Autorzy: Iwo Błądek Konrad Miazga Oświadczamy, że w trakcie produkcji tego tutoriala nie zginęły żadne zwierzęta,
Bardziej szczegółowo2.2 Opis części programowej
2.2 Opis części programowej Rysunek 1: Panel frontowy aplikacji. System pomiarowy został w całości zintegrowany w środowisku LabVIEW. Aplikacja uruchamiana na komputerze zarządza przebiegiem pomiarów poprzez
Bardziej szczegółowoProblem Komiwojażera - algorytmy metaheurystyczne
Problem Komiwojażera - algorytmy metaheurystyczne algorytm mrówkowy algorytm genetyczny by Bartosz Tomeczko. All rights reserved. 2010. TSP dlaczego metaheurystyki i heurystyki? TSP Travelling Salesman
Bardziej szczegółowoAnaliza zmienności czasowej danych mikromacierzowych
Systemy Inteligencji Obliczeniowej Analiza zmienności czasowej danych mikromacierzowych Kornel Chromiński Instytut Informatyki Uniwersytet Śląski Plan prezentacji Dane mikromacierzowe Cel badań Prezentacja
Bardziej szczegółowoEgzamin, AISDI, I termin, 18 czerwca 2015 r.
Egzamin, AISDI, I termin, 18 czerwca 2015 r. 1 W czasie niezależnym do danych wejściowych działają algorytmy A. sortowanie bąbelkowego i Shella B. sortowanie szybkiego i przez prosty wybór C. przez podział
Bardziej szczegółowoBioinformatyka. Ocena wiarygodności dopasowania sekwencji.
Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie
Bardziej szczegółowoPrzyrównanie sekwencji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Przyrównanie sekwencji Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Sequence alignment - przyrównanie sekwencji Poszukiwanie ciągów znaków (zasad nukleotydowych lub reszt aminokwasowych),
Bardziej szczegółowoWprowadzania liczb. Aby uniknąć wprowadzania ułamka jako daty, należy poprzedzać ułamki cyfrą 0 (zero); np.: wpisać 0 1/2
Wprowadzania liczb Liczby wpisywane w komórce są wartościami stałymi. W Excel'u liczba może zawierać tylko następujące znaki: 0 1 2 3 4 5 6 7 8 9 + - ( ), / $ %. E e Excel ignoruje znaki plus (+) umieszczone
Bardziej szczegółowoPODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA
PODSTAWY BIOINFORMATYKI 6 ANALIZA FILOGENETYCZNA ANALIZA FILOGENETYCZNA 1. Wstęp - filogenetyka 2. Struktura drzewa filogenetycznego 3. Metody konstrukcji drzewa - przykłady 4. Etapy konstrukcji drzewa
Bardziej szczegółowoIle waży arbuz? Copyright Łukasz Sławiński
Ile waży arbuz? Arbuz ważył7kg z czego 99 % stanowiła woda. Po tygodniu wysechł i woda stanowi 98 %. Nieważne jak zmierzono te %% oblicz ile waży arbuz teraz? Zanim zaczniemy, spróbuj ocenić to na wyczucie...
Bardziej szczegółowoBudowa i rola DNA. 1. Cele lekcji. a) Wiadomości. b) Umiejętności. 2. Metoda i forma pracy. 3. Środki dydaktyczne. Metadane scenariusza
Metadane scenariusza Budowa i rola DNA 1. Cele lekcji a) Wiadomości Uczeń: zna nazwy związków chemicznych budujących cząsteczkę DNA i wie, jak są ze sobą powiązane, wie, jak wygląda model przestrzenny
Bardziej szczegółowoJak rozłożyć krzywą na poszczególne piki, które ją tworzą? Czyli krótki kurs Origina;)
Jak rozłożyć krzywą na poszczególne piki, które ją tworzą? Czyli krótki kurs Origina;) Laboratorium Fizyki i Techniki Jądrowej autor: Dariusz Aksamit 26.04.2017 1. Rzucamy dane na wykres 2. Ogarniamy
Bardziej szczegółowoInstytut Politechniczny Państwowa Wyższa Szkoła Zawodowa TECHNIKI REGULACJI AUTOMATYCZNEJ
Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa TECHNIKI REGULACJI AUTOMATYCZNEJ Laboratorium nr 2 Podstawy środowiska Matlab/Simulink część 2 1. Cel ćwiczenia: Celem ćwiczenia jest zapoznanie
Bardziej szczegółowoINSTRUKCJA OTWIERANIA PLIKU DPT (data point table)
INSTRUKCJA OTWIERANIA PLIKU DPT (data point table) Plik DPT jest tekstowym zapisem widma. Otwarty w notatniku wygląda następująco: Aby móc stworzyć wykres, należy tak zaimportować plik do arkusza kalkulacyjnego,
Bardziej szczegółowoSprawdzanie pracy w JSA z poziomu systemu uczelnianego
Sprawdzanie pracy w JSA uczelnianego Perspektywa promotora 2019 r. Rozpocznij Czym się różni badanie pracy od badania JSA? System uczelniany Interfejs JSA za pośrednictwem uczelnianego nie wymaga posiadania
Bardziej szczegółowoTrik 1 Identyfikator klienta generowany za pomocą formuły
:: Trik 1. Identyfikator klienta generowany za pomocą formuły :: Trik 2. Warunkowe podsumowanie z wielu kolumn :: Trik 3. Komunikaty o błędach niewidoczne na wydruku :: Trik 4. Wyliczanie wynagrodzenia
Bardziej szczegółowo