Analiza danych pochodzących z sekwencjonowania nowej generacji - przyrównanie do genomu referencyjnego. - część I -
|
|
- Maja Kujawa
- 9 lat temu
- Przeglądów:
Transkrypt
1 pochodzących z sekwencjonowania nowej generacji - przyrównanie do genomu referencyjnego - część I - Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
2 Plan wykładów część I Wstęp: - Sekwencjonowanie nowej generacji (NGS) - Przyrównanie do genomu referencyjnego - Formaty sekwencji (input) Wybór odpowiedniego środowiska i praca w nim Wizualizacja/ analiza sekwencji część II Wybór programów do: - przyrównywania sekwencji - do wizualizacji przyrównania Formaty sekwencji (output) 2
3 Sekwencjonowanie nowej generacji (NGS) Równoległe sekwencjonowanie wielu bardzo krótkich fragmentów DNA unieruchomionych na podłożu Sekwencjonowanie całych genomów! Efekt bardzo krótkie fragmenty (reads) Relatywnie tanie Relatywnie szybkie Platformy: Ilumina/Solexa, Roche, SOLiD 3
4 Przyrównanie do sekwencji referencyjnej złożenie krótkich fragmentów read ACTGGGGGGGAAAAA GGGAAAAATTTC GGGAACCTTTC CCTTTCTTTGGA reference ACTGGGGGGGAAAAATTTCAAAGGGAACCTTTCTTTGGAGGGTT *Reads podsekwencje genomu referencyjnego 4
5 Sekwencja referencyjna (FASTA) - genom - część genomu - transkryptom 5
6 Krótkie fragmenty sekwencji (FASTQ) SRA FASTQ 6
7 FASTA A Adenozyna C Cytozyna G Guanina T Tymina U Uracyl R G A (puryna) Y T C (pirymidyna) S G C (Silne oddziaływanie) W A T (słabe (ang. Weak) oddziaływanie) B G T C (nie A) (B jest po A) D G A T (nie C) (D jest po C) 7 H A C T (nie G) (H jest po G) V G C A (nie T) (V jest po U) N A G C T (którykolwiek, od ang. any)
8 FASTQ 8
9 Środowisko pracy Linux Dlaczego Linux? Dlaczego serwer? PRZYKŁADOWE KOMENDY: zcat ścieżka/plik.fastq.gz less zcat ścieżka/plik.fastq.gz wc l zcat ścieżka/plik.fastq.gz grep szukane znaki wc l zcat ścieżka/plik.fastq.gz head n > top_10000.fastq zcat ścieżka/plik.fastq.gz bottom n > bottom_10000.fastq 9
10 10
11 Modyfikacja sekwencji: wycinanie adaptorów usuwanie sekwencji o kiepskiej jakości FASTQ FASTA itp... 11
12 FASTQC Kontrola jakości danych (FASTQ, SAM, BAM) Graficzne przedstawienie sekwencji 12
13 Basic statistics 13
14 Per base sequence quality Jakość dla każdej pozycji Mediana Wykres pudełkowy Max/min Średnia Ostrzeżenie niższy kwartyl dla jakiejkolwiek pozycji <10 lub mediana <25 Awaria niższy kwartyl dla jakiejkolwiek pozycji <5 lub mediana <20 14
15 Per sequence quality scores Średnia jakość sekwencji Ostrzeżenie najczęściej obserwowane średnia jakość <27 Awaria najczęściej obserwowane średnia jakość< 20 15
16 Per base sequence content Proporcje zasad azotowych Ostrzeżenie różnica między A i T lub G i C > 10%, w którejkolwiek pozycji Awaria różnica między A i T lub G i C > 20%, w którejkolwiek pozycji 16
17 Per base GC content Odchylenie od średniej wartości dla każdej pozycji Ostrzeżenie odchylenie od średniej wartości GC > 5% Awaria odchylenie od średniej wartości GC > 10% 17
18 Per sequence GC content Ostrzeżenie suma odchyleń od rozkładu normalnego > 15% Awaria suma odchyleń od rozkładu normalnego > 30% 18
19 Per base N content Ostrzeżenie dowolna pozycja pokazuje zawartość N> 5%. Awaria dowolna pozycja pokazuje zawartość N> 20%. 19
20 Sequence Length Distribution Ostrzeżenie sekwencje nie są tej samej długości. Awaria którakolwiek sekwencja ma długość 0 20
21 Sequence Duplication Levels Ostrzeżenie sekwencje nieunikalne >20% Awaria sekwencje nieunikalne >50% 21
22 Overrepresented sequences Ostrzeżenie którakolwiek sekwencja występuje > 0,1% Awaria którakolwiek sekwencja występuje > 1% No overrepresented sequences 22
23 - Koniec części I - 23
Podstawy bioinformatyki sekwencjonowanie nowej generacji. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Podstawy bioinformatyki sekwencjonowanie nowej generacji Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Rozwój technologii i przyrost danych Wzrost olbrzymiej ilości i objętości
PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS
PODSTAWY BIOINFORMATYKI WYKŁAD 4 ANALIZA DANYCH NGS SEKWENCJONOWANIE GENOMÓW NEXT GENERATION METODA NOWEJ GENERACJI Sekwencjonowanie bardzo krótkich fragmentów 50-700 bp DNA unieruchomione na płytce Szybkie
ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI
ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI JOANNA SZYDA MAGDALENA FRĄSZCZAK MAGDA MIELCZAREK WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki 3. Projekty NGS 4. Charakterystyka
ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI
ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI Joanna Szyda Magdalena Frąszczak Magda Mielczarek WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki 3. Projekty NGS 4. Charakterystyka
Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing. Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno
Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno Macierze tkankowe TMA ang. Tissue microarray Technika opisana w 1987 roku (Wan i
BASH - WPROWADZENIE Bioinformatyka 4
BASH - WPROWADZENIE Bioinformatyka 4 DLACZEGO BASH? Praca na klastrach obliczeniowych Brak GUI Środowisko programistyczne Szybkie przetwarzanie danych Pisanie własnych skryptów W praktyce przetwarzanie
POPULARNE POLECENIA SKRYPTY. Pracownia Informatyczna 2
SKRYPTY Pracownia Informatyczna 2 PRACOWNIA INFORMATYCZNA 2017/2018 MAGDA MIELCZAREK PRACOWNIA INFORMATYCZNA 2017/2018 MAGDA MIELCZAREK 2 cal wyświetlenie kalendarza Składnia: cal 2017, cal Polecenie cal
PRACOWNIA INFORMATYCZNA CHARAKTERYSTYKA PRZEDMIOTU BASH - PODSTAWOWE INFORMACJE
PRACOWNIA INFORMATYCZNA CHARAKTERYSTYKA PRZEDMIOTU BASH - PODSTAWOWE INFORMACJE M.Mielczarek Pracownia Informatyczna 2017/2018 1 PRACOWNIA INFORMATYCZNA PROWADZĄCY: Dr Magda Mielczarek (biolog) Katedra
Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.
Temat: WYKRYWANIE ODCHYLEO W DANYCH Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej. Przykładem Box Plot wygodną metodą
CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1
CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1 PRACOWNIA INFORMATYCZNA PROWADZĄCY: Dr Magda Mielczarek (biolog) Katedra Genetyki, pokój nr 21
Przydatność technologii Sekwencjonowania Nowej Generacji (NGS) w kolekcjach Banków Genów Joanna Noceń Kinga Smolińska Marta Puchta Kierownik tematu:
Przydatność technologii Sekwencjonowania Nowej Generacji (NGS) w kolekcjach Banków Genów Joanna Noceń Kinga Smolińska Marta Puchta Kierownik tematu: prof. dr hab. Jerzy H. Czembor SEKWENCJONOWANIE I generacji
PODSTAWY BIOINFORMATYKI WYKŁAD 2 SEKWENCJONOWANIE GENOMÓW
PODSTAWY BIOINFORMATYKI WYKŁAD 2 SEKWENCJONOWANIE GENOMÓW SEKWENCJONOWANIE GENOMÓW 1. Sekwencjonowanie genomów 2. Automatyzacja sekwencjonowania 3. 1 000 (human) Genomes project 4. 1 000 Bull Genomes project
-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak
Wzory dla szeregu szczegółowego: Wzory dla szeregu rozdzielczego punktowego: ->Średnia arytmetyczna ważona -> Średnia arytmetyczna (5) ->Średnia harmoniczna (1) ->Średnia harmoniczna (6) (2) ->Średnia
Pracownia Informatyczna I ORGANIZACJA ZAJĘĆ, ZASADY ZALICZENIA
Pracownia Informatyczna I ORGANIZACJA ZAJĘĆ, ZASADY ZALICZENIA 1 Organizacja zajęć ½ semestru mgr Magda Mielczarek Katedra Genetyki, pokój nr 14 e-mail: magda.mielczarek@up.wroc.pl tel: 71-320-57-51 Slajdy
Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2
ALEKSANDRA ŚWIERCZ Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2 Ekspresja genów http://genome.wellcome.ac.uk/doc_wtd020757.html A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH
Zakłady Azotowe w Tarnowie-Mościcach S.A. ul. E. Kwiatkowskiego 8 33-101 Tarnów t: +48 14 633 07 81-85 f: +48 14 633 07 18
1) 2) 3) 4) 5) 6) 7) 8) 9) 10) 11) 12) 13) 14) 15) 16) 17) 18) 19) 20) 21) 22) 23) 24) 25) 26) Zakłady Azotowe 27) 28) 29) 30) 31) 32) Zakłady Azotowe a) b) c) Zakłady Azotowe d) e) f) g) h) i) a)
PODSTAWY BIOINFORMATYKI 3 SEKWENCJONOWANIE GENOMÓW I
PODSTAWY BIOINFORMATYKI 3 SEKWENCJONOWANIE GENOMÓW I PROJEKTY POZNANIA INNYCH GENOMÓW 1 400 2009 2010 1 200 2011 2012 1 000 800 600 400 200 986 1153 1285 914 954 717 759 757 251 254 889 0 23 ukończone
System operacyjny Linux wybrane zagadnienia. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
System operacyjny Linux wybrane zagadnienia Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Linux Open Source Stale rozwijany Darmowy (wersje niekomercyjne) Bezpieczny Stabilny
Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie... 3. 2 Wprowadzenie do biologicznych baz danych...
Przedmowa... XI Część pierwsza Wprowadzenie i biologiczne bazy danych 1 Wprowadzenie... 3 Czym jest bioinformatyka?... 5 Cele... 5 Zakres zainteresowań... 6 Zastosowania... 7 Ograniczenia... 8 Przyszłe
PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (1)
PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (1) BIOINFORMATYKA HISTORIA 1. 1982 utworzenie bazy danych GenBank (NIH) dane ogólnodostępne sekwencje nukleotydów 2. Wprowadzenie sekwencji z projektu
"Zapisane w genach, czyli Python a tajemnice naszego genomu."
"Zapisane w genach, czyli Python a tajemnice naszego genomu." Dr Kaja Milanowska Instytut Biologii Molekularnej i Biotechnologii UAM VitaInSilica sp. z o.o. Warszawa, 9 lutego 2015 Dane biomedyczne 1)
PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2)
PODSTAWY BIOINFORMATYKI WYKŁAD 3 BIOLOGICZNE BAZY DANYCH (2) BIOINFORMATYKA HISTORIA 1. 1982 utworzenie bazy danych GenBank (NIH) dane ogólnodostępne sekwencje nukleotydów 2. Wprowadzenie sekwencji z projektu
Sekwencjonowanie, przewidywanie genów
Instytut Informatyki i Matematyki Komputerowej UJ, opracowanie: mgr Ewa Matczyńska, dr Jacek Śmietański Sekwencjonowanie, przewidywanie genów 1. Technologie sekwencjonowania Genomem nazywamy sekwencję
Statystyki opisowe i szeregi rozdzielcze
Statystyki opisowe i szeregi rozdzielcze - ćwiczenia ĆWICZENIA Piotr Ciskowski ramka-wąsy przykład 1. krwinki czerwone Stanisz W eksperymencie farmakologicznym analizowano oddziaływanie pewnego preparatu
Analizy wielkoskalowe w badaniach chromatyny
Analizy wielkoskalowe w badaniach chromatyny Analizy wielkoskalowe wykorzystujące mikromacierze DNA Genotypowanie: zróżnicowane wewnątrz genów RNA Komórka eukariotyczna Ekspresja genów: Które geny? Poziom
Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing
Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Wykład 7 Etapy analizy NGS Dr Wioleta Drobik-Czwarno Etapy analizy NGS Kontrola jakości surowych danych (format fastq) Jakość odczytów,
INFORMATYKA W SELEKCJI
INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI - zagadnienia 1. Dane w pracy hodowlanej praca z dużym zbiorem danych (Excel) 2. Podstawy pracy z relacyjną bazą danych w programie MS Access 3. Systemy statystyczne
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY Liczebności i częstości Liczebność liczba osób/respondentów/badanych, którzy udzielili tej konkretnej odpowiedzi. Podawana w osobach. Częstość odsetek,
STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)
STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) Dla opisania rozkładu badanej zmiennej, korzystamy z pewnych charakterystyk liczbowych. Dzielimy je na cztery grupy.. Określenie przeciętnej wartości
BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH
http://theta.edu.pl/ Podstawy Bioinformatyki II BIOINFORMATYKA BIOLOGICZNE BAZY DANYCH 1 Czym jest bioinformatyka? 2 Bioinformatyka Bioinformatyka jest interdyscyplinarną dziedziną nauki obejmującą wykorzystanie
Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing
Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing Wykład 7 Etapy analizy NGS Dr Wioleta Drobik-Czwarno Etapy analizy NGS Kontrola jakości surowych danych (format fastq) Jakość odczytów,
Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe
Typy zmiennych Graficzne reprezentacje danych Statystyki opisowe Jakościowe charakterystyka przyjmuje kilka możliwych wartości, które definiują klasy Porządkowe: odpowiedzi na pytania w ankiecie ; nigdy,
Ćwiczenie 12. Diagnostyka molekularna. Poszukiwanie SNPs Odczytywanie danych z sekwencjonowania. Prof. dr hab. Roman Zieliński
Ćwiczenie 12 Diagnostyka molekularna. Poszukiwanie SNPs Odczytywanie danych z sekwencjonowania Prof. dr hab. Roman Zieliński 1. Diagnostyka molekularna 1.1. Pytania i zagadnienia 1.1.1. Jak definiujemy
Bioinformatyczne bazy danych
Bioinformatyczne bazy danych Czym jest bioinformatyka? Bioinformatyka jest nauką integrującą różne dziedziny wiedzy Gruca (2010) Czym jest bioinformatyka? Bioinformatyka obejmuje technologie wykorzystujące
Bioinformatyka Laboratorium, 30h. Michał Bereta
Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecność Literatura, materiały Bioinformatyka i ewolucja
Bioinformatyka Laboratorium, 30h. Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl
Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecnośd Literatura, materiały Bioinformatyka i ewolucja
Bioinformatyczne bazy danych
Bioinformatyczne bazy danych Czym jest bioinformatyka? Bioinformatyka jest nauką integrującą różne dziedziny wiedzy Gruca (2010) http://bioinformaticsonline.com/file/view/4482/bioinformatics-definitions-and-applications
MARKERY MIKROSATELITARNE
MARKERY MIKROSATELITARNE Badania laboratoryjne prowadzone w Katedrze Genetyki i Ogólnej Hodowli Zwierząt SGGW w ramach monitoringu genetycznego wykorzystują analizę genetyczną markerów mikrosatelitarnych.
Ćwiczenia nr 5. Wykorzystanie baz danych i narzędzi analitycznych dostępnych online
Techniki molekularne ćw. 5 1 z 13 Ćwiczenia nr 5. Wykorzystanie baz danych i narzędzi analitycznych dostępnych online I. Zasoby NCBI Strona: http://www.ncbi.nlm.nih.gov/ stanowi punkt startowy dla eksploracji
Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła
12.03.2017 Wydział Inżynierii Produkcji I Logistyki Statystyka opisowa Wykład 3 Dr inż. Adam Deptuła METODY OPISU DANYCH ILOŚCIOWYCH SKALARNYCH Wykresy: diagramy, histogramy, łamane częstości, wykresy
SPRAWDZIAN NR 1 ROBERT KOPERCZAK, ID studenta : k4342
TECHNIKI ANALITYCZNE W BIZNESIE SPRAWDZIAN NR 1 Autor pracy ROBERT KOPERCZAK, ID studenta : k4342 Kraków, 22 Grudnia 2009 2 Spis treści 1 Zadanie 1... 3 1.1 Szereg rozdzielczy wag kobiałek.... 4 1.2 Histogram
ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI
ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI Podstawy Bioinformatyki lab 1 PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 1 BIOINFORMATYKA Dr Magda Mielczarek Katedra Genetyki, pokój nr 14 ul. Kożuchowska
liczba punktów Wykres 1. Rozkład wyników części I etapu pisemnego dla zawodu technik mechatronik w skali kraju
I.1.1. Technik mechatronik 311[5] Do egzaminu zostało zgłoszonych: 235 Przystąpiło łącznie:2 przystąpiło: 191 ETAP PISEMNY ETAP PRAKTYCZNY zdało: 147 (3,) DYPLOM POTWIERDZAJĄCY KWALIFIKACJE ZAWODOWE przystąpiło:
STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)
STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) Praca z danymi zaczyna się od badania rozkładu liczebności (częstości) zmiennych. Rozkład liczebności (częstości) zmiennej to jakie wartości zmienna
PODSTAWY BIOINFORMATYKI
PODSTAWY BIOINFORMATYKI Prowadzący: JOANNA SZYDA ADRIAN DROśDś WSTĘP 1. Katedra Genetyki badania bioinformatyczne 2. Tematyka przedmiotu 3. Charakterystyka wykładów 4. Charakterystyka ćwiczeń 5. Informacje
Przeglądarki genomowe
Przeglądarki genomowe Popularne typy danych w nowoczesnych naukach biologicznych obejmują: sekwencje genomu sekwencje transkryptomu sekwencje proteomu epigenom adnotacje: geny, eksony, introny, izoformy,
Bioinformatyka Laboratorium, 30h. Michał Bereta
Laboratorium, 30h Michał Bereta mbereta@pk.edu.pl www.michalbereta.pl Zasady zaliczenia przedmiotu Kolokwia (3 4 ) Ocena aktywności i przygotowania Obecnośd Literatura, materiały i ewolucja molekularna
Z-LOGN1-006 Statystyka Statistics
KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Z-LOGN-006 Statystyka Statistics Obowiązuje od roku akademickiego 0/0 A. USYTUOWANIE MODUŁU W SYSTEMIE STUDIÓW Kierunek
BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE. Pracownia Informatyczna 2
BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE Pracownia Informatyczna 2 WYBRANE BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE NCBI Ensembl UCSC NATIONAL CENTER FOR BIOTECHNOLOGY INFORMATION NCBI Utworzone
Z-ZIPN1-004 Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki Niestacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta
KARTA MODUŁU / KARTA PRZEDMIOTU Z-ZIPN-004 Statystyka Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Statistics Obowiązuje od roku akademickiego 0/04 A. USYTUOWANIE MODUŁU W SYSTEMIE STUDIÓW
PAKIETY STATYSTYCZNE
1. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa
BASH - LINIA POLECEŃ. Bioinformatyka 2018/2019
BASH - LINIA POLECEŃ Bioinformatyka 2018/2019 PODSTAWOWE DEFINICJE Linux system operacyjny, które oferuje kompletne środowisko programistyczne Powłoka interfejs wiersza poleceń zapewniający komunikację
AVARUS Benchmark cen zakupu
AVARUS Benchmark cen zakupu Porównywarka cen podstawowych produktów i usług zakupywanych przez szpitale Raport dla: Szpital Przykładowy Warszawa, 3 kwiecień 2014 Niniejszy raport został przygotowany przez
Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?
1 Zadanie 1.1 W dwóch zakładach produkcyjnych Złomex I i Złomex II, należących do tego samego przedsiębiorstwa Złomowanie na zawołanie w ostatnim miesiącu następująco kształtowały się wynagrodzenia pracowników.
Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport
Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport Michał Krzemiński Streszczenie Projekt dotyczy metod generowania oraz badania własności statystycznych ciągów liczb pseudolosowych.
PRACOWNIA INFORMATYCZNA BASH - PODSTAWOWE INFORMACJE
PRACOWNIA INFORMATYCZNA BASH - PODSTAWOWE INFORMACJE Magda Mielczarek Pracownia Informatyczna 2015/2016 1 Podstawowe definicje Linux system operacyjny, które oferuje kompletne środowisko programistyczne
Metody badania polimorfizmu/mutacji DNA. Aleksandra Sałagacka Pracownia Diagnostyki Molekularnej i Farmakogenomiki Uniwersytet Medyczny w Łodzi
Metody badania polimorfizmu/mutacji DNA Aleksandra Sałagacka Pracownia Diagnostyki Molekularnej i Farmakogenomiki Uniwersytet Medyczny w Łodzi Mutacja Mutacja (łac. mutatio zmiana) - zmiana materialnego
Podstawy bioinformatyki - biologiczne bazy danych
Podstawy bioinformatyki - biologiczne bazy danych Czym jest bioinformatyka? Bioinformatyka Bioinformatyka jest interdyscyplinarną dziedziną nauki obejmującą wykorzystanie metod obliczeniowych do badania
WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19
WSTĘP DO BIOINFORMATYKI Konspekt wykładu - wiosna 2018/19 Witold Dyrka 14 marca 2019 1 Wprowadzenie 1.1 Definicje bioinformatyki Według polskiej Wikipedii [1], Bioinformatyka interdyscyplinarna dziedzina
Laboratorium nr Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby:
Laboratorium nr 1 CZĘŚĆ I : STATYSTYKA OPISOWA : 1. Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby: 6,9,1,2,5,2,6,2,1,0,1,4,5,6,3,7,3,2,2,3,8,5,3,4,8,0,8,0,5,1,6,4,8,0,3,2
PAKIETY STATYSTYCZNE
1. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa
2.Wstępna analiza danych c.d.- wykład z 5.03.2006 Populacja i próba
2.Wstępna analiza danych c.d.- wykład z 5.03.2006 Populacja i próba Populacja- zbiorowość skończona lub nieskończona, w stosunku do której mają być formułowane wnioski. Próba- skończony podzbiór populacji
MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy
MIARY POŁOŻENIA Opisują średni lub typowy poziom wartości cechy. Określają tą wartość cechy, wokół której skupiają się wszystkie pozostałe wartości badanej cechy. Wśród nich można wyróżnić miary tendencji
października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II
10 października 2013: Elementarz biologii molekularnej www.bioalgorithms.info Wykład nr 2 BIOINFORMATYKA rok II Komórka: strukturalna i funkcjonalne jednostka organizmu żywego Jądro komórkowe: chroniona
Scenariusz lekcji przyrody/biologii (2 jednostki lekcyjne)
Joanna Wieczorek Scenariusz lekcji przyrody/biologii (2 jednostki lekcyjne) Strona 1 Temat: Budowa i funkcje kwasów nukleinowych Cel ogólny lekcji: Poznanie budowy i funkcji: DNA i RNA Cele szczegółowe:
Przetarg nieograniczony na zakup specjalistycznej aparatury laboratoryjnej Znak sprawy: DZ-2501/6/17
Część nr 2: SEKWENATOR NASTĘPNEJ GENERACJI Z ZESTAWEM DEDYKOWANYCH ODCZYNNIKÓW Określenie przedmiotu zamówienia zgodnie ze Wspólnym Słownikiem Zamówień (CPV): 38500000-0 aparatura kontrolna i badawcza
DHPLC. Denaturing high performance liquid chromatography. Wiktoria Stańczyk Zofia Kołeczko
DHPLC Denaturing high performance liquid chromatography Wiktoria Stańczyk Zofia Kołeczko Mini-słowniczek SNP (Single Nucleotide Polymorphism) - zmienność sekwencji DNA; HET - analiza heterodupleksów; HPLC
Dane mikromacierzowe. Mateusz Markowicz Marta Stańska
Dane mikromacierzowe Mateusz Markowicz Marta Stańska Mikromacierz Mikromacierz DNA (ang. DNA microarray) to szklana lub plastikowa płytka (o maksymalnych wymiarach 2,5 cm x 7,5 cm) z naniesionymi w regularnych
I.1.1. Technik informatyk 312[01]
I.1.1. Technik informatyk 312[1] Do egzaminu zostało zgłoszonych: 13 884 Przystąpiło łącznie: 1 168 przystąpiło: 1 58 ETAP PISEMNY ETAP PRAKTYCZNY zdało: 6 975 (69,3%) DYPLOM POTWIERDZAJĄCY KWALIFIKACJE
1. System analizy danych NGS z paneli genów
1. System analizy danych NGS z paneli genów (programistyczny) Sekwenator to instrument odczytujący sekwencję DNA w kilku-kilkudziesieciu probkach na raz. Instrument zapisuje na dysku dane w skompresowanych
SYLABUS DOTYCZY CYKLU KSZTAŁCENIA
SYLABUS DOTYCZY CYKLU KSZTAŁCENIA 2015-2021 1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE Nazwa przedmiotu/ modułu Techniki biologii molekularnej Kod przedmiotu/ modułu* Wydział (nazwa jednostki prowadzącej
Konstruowanie drzew filogenetycznych. Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Konstruowanie drzew filogenetycznych Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Drzewa filogenetyczne ukorzenione i nieukorzenione binarność konstrukcji topologia (sposób rozgałęziana
Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.
Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Województwo Urodzenia według płci noworodka i województwa. ; Rok 2008; POLSKA Ogółem Miasta Wieś Pozamałżeńskie- Miasta Pozamałżeńskie-
Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018
STATYSTYKA OPISOWA Dr Alina Gleska Instytut Matematyki WE PP 6 marca 2018 1 MIARY ZMIENNOŚCI (inaczej: rozproszenia, rozrzutu, zróżnicowania, dyspersji) informuja o zróżnicowaniu jednostek zbiorowości
PL 217144 B1. Sposób amplifikacji DNA w łańcuchowej reakcji polimerazy za pomocą starterów specyficznych dla genu receptora 2-adrenergicznego
PL 217144 B1 RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 217144 (13) B1 Urząd Patentowy Rzeczypospolitej Polskiej (21) Numer zgłoszenia: 391926 (22) Data zgłoszenia: 23.07.2010 (51) Int.Cl.
Bash - wprowadzenie. Bash - wprowadzenie 1/39
Bash - wprowadzenie Bash - wprowadzenie 1/39 Bash - wprowadzenie 2/39 Czym jest bash? Rysunek : Zadanie powłoki to ukrycie wywołań systemowych Bash - wprowadzenie 3/39 Czym jest bash? Przykład polecenia:
BUDOWA I FUNKCJA GENOMU LUDZKIEGO
BUDOWA I FUNKCJA GENOMU LUDZKIEGO Magdalena Mayer Katedra i Zakład Genetyki Medycznej UM w Poznaniu 1. Projekt poznania genomu człowieka: Cele programu: - skonstruowanie szczegółowych map fizycznych i
PAKIETY STATYSTYCZNE 5. SAS wprowadzenie - środowisko Windows
PAKIETY STATYSTYCZNE 1. Wykład wstępny 2. Statistica wprowadzenie 3. Statistica elementy analizy danych 4. Statistica wykresy 5. SAS wprowadzenie - środowisko Windows 6. SAS wprowadzenie - środowisko Linux
Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.
Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych. Statystyka zajmuje się prawidłowościami zaistniałych zdarzeń. Teoria prawdopodobieństwa dotyczy przewidywania, jak często mogą zajść
SPRAWOZDANIE Z EGZAMINU GIMNAZJALNEGO PRZEPROWADZONEGO W SZKOŁACH DLA DOROSŁYCH W STYCZNIU 2017 ROKU OKRĘGOWA KOMISJA EGZAMINACYJNA W WARSZAWIE
SPRAWOZDANIE Z EGZAMINU GIMNAZJALNEGO PRZEPROWADZONEGO W SZKOŁACH DLA DOROSŁYCH W STYCZNIU 0 ROKU OKRĘGOWA KOMISJA EGZAMINACYJNA W WARSZAWIE 00- WARSZAWA, Plac Europejski tel. 0, fax 0 http:// www.oke.waw.pl
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.
ENZYMY RESTRYKCYJNE ENZYMY RESTRYKCYJNE CZYM RÓŻNIĄ SIĘ POSZCZEGÓLNE ENZYMY? nazewnictwo: EcoRV
ENZYMY RESTRYKCYJNE Enzymy z klasy endonukleaz (hydrolaz), wykazujące powinowactwo do specyficznych fragmentów dwuniciowych cząsteczek DNA i hydrolizujące wiązania fosfodiestrowe w obu niciach Naturalnie
Zmienność. środa, 23 listopada 11
Zmienność http://ggoralski.com Zmienność Zmienność - rodzaje Zmienność obserwuje się zarówno między poszczególnymi osobnikami jak i między populacjami. Różnice te mogą mieć jednak różne podłoże. Mogą one
Najbardziej Wiarygodny, Nieinwazyjny Test Prenatalny wykonywany w Polsce Test NIFTY : tylko mała próbka krwi ciężarnej
Najbardziej Wiarygodny, Nieinwazyjny Test Prenatalny wykonywany w Polsce Test NIFTY : To nieinwazyjny, genetyczny test prenatalny nowej generacji, który określa ryzyko trisomii chromosomów 21, 18 i 13
Porównywanie i dopasowywanie sekwencji
Porównywanie i dopasowywanie sekwencji Związek bioinformatyki z ewolucją Wraz ze wzrostem dostępności sekwencji DNA i białek pojawiła się nowa możliwość śledzenia ewolucji na poziomie molekularnym Ewolucja
Podstawy biologiczne - komórki. Podstawy biologiczne - cząsteczki. Model komórki eukariotycznej. Wprowadzenie do Informatyki Biomedycznej
Wprowadzenie do Informatyki Biomedycznej Wykład 1: Podstawy bioinformatyki Wydział Informatyki PB Podstawy biologiczne - komórki Wszystkie organizmy zbudowane są z komórek komórka jest skomplikowanym systemem
I.1.1. Technik elektronik 311[07]
I.1.1. Technik elektronik 311[7] Do egzaminu zostało zgłoszonych: 11 8 Przystąpiło łącznie: 1 58 przystąpiło: 1 7 przystąpiło: ETAP PISEMNY ETAP PRAKTYCZNY zdało: 4 324 (42,9%) zdało: DYPLOM POTWIERDZAJĄCY
GENETYKA POPULACJI. Ćwiczenia 5 Biologia I MGR
GENETYKA POPULACJI Ćwiczenia 5 Biologia I MGR WSPÓŁCZESNA GENETYKA POPULACJI CÓRKA TRZECH MATEK TRZY MATKI trzy rewolucje dotyczące teorii i technologii 1) Rewolucja koncepcyjna: wyłoniona z teorii koalescencji,
SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ MAGDALENA FRĄSZCZAK
SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ Prowadzący: JOANNA SZYDA MAGDALENA FRĄSZCZAK WSTĘP 1. Systemy informatyczne w hodowli -??? 2. Katedra Genetyki 3. Pracownia biostatystyki - wykorzystanie narzędzi
PODSTAWY BIOINFORMATYKI ORGANIZACJA ZAJĘĆ BIOINFORMATYKA PRZETWARZANIE I ANALIZA DANYCH
PODSTAWY BIOINFORMATYKI ORGANIZACJA ZAJĘĆ BIOINFORMATYKA PRZETWARZANIE I ANALIZA DANYCH Magda Mielczarek Podstawy Bioinformatyki 1 Organizacja zajęć mgr Magda Mielczarek Katedra Genetyki, pokój nr 14 magda.mielczarek@up.wroc.pl
Laboratorium 3 - statystyka opisowa
dla szeregu rozdzielczego Laboratorium 3 - statystyka opisowa Agnieszka Mensfelt 11 lutego 2019 dla szeregu rozdzielczego Statystyka opisowa dla szeregu rozdzielczego Przykład wyniki maratonu Wyniki 18.
Analizy wariancji ANOVA (analysis of variance)
ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza
I Krajowy Zjazd Szkoleniowy PTORLChGiSz
ul. Bytkowska 1B,40-955 Katowice, POLSKA tel.: +48 / 32 / 25 98 399, fax: +48 / 32 / 25 98 398 email: altasoft@altasoft.pl www.altasoft.pl I Krajowy Zjazd Szkoleniowy PTORLChGiSz 17-19.11.2011 Podsumowanie
1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:
Wariancja z populacji: Podstawowe miary rozproszenia: 1 1 s x x x x k 2 2 k 2 2 i i n i1 n i1 Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: 1 k 2 s xi x n 1 i1 2 Przykład 38,
Skrypt Bioinformatyka DRAFT Strona 67
Spis treści 5 Budowa kwasów nukleinowych... 68 5.1 Nukleotydy... 68 5.2 Łaocuch polinukleotydowy... 71 5.3 Nić komplementarna... 71 6 Centralny dogmat Biologii Molekularnej... 74 7 Przepływ informacji
Ekologia molekularna. wykład 11
Ekologia molekularna wykład 11 Sekwencjonowanie nowej generacji NGS = next generation sequencing = high throughput sequencing = massive pararell sequencing =... Różne techniki i platformy Illumina (MiSeq,
Wprowadzenie do Pakietu R dla kierunku Zootechnika. Dr Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Wprowadzenie do Pakietu R dla kierunku Zootechnika Dr Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu Instalacja Pakietu R www.r-project.org wybór źródła wybór systemu operacyjnego: