Dane wielowymiarowe i ich analiza w badaniach nad roślinami
|
|
- Leszek Kulesza
- 4 lat temu
- Przeglądów:
Transkrypt
1 Dane wielowymiarowe i ich analiza w badaniach nad roślinami Paweł Krajewski Zakład Biometrii i Bioinformatyki Instytut Genetyki Roślin PAN w Poznaniu pkra@igr.poznan.pl Wykłady Otwarte, UAM, Poznań, r.
2 Tematyka badań Zespołu Biometrii i Bioinformatyki IGR PAN 1. Metody analizy danych z sekwencjonowania wysokoprzepustowego DNA (NGS) 2. Metody adnotacji i standaryzacji danych biologicznych 3. Współpraca z biologami analiza i interpretacja danych doświadczalnych Metody wielowymiarowe: - Wykorzystanie na przykładzie projektu POLAPGEN-BD - Nowe zastosowania w analizie danych NGS
3 Projekt POLAPGEN-BD Badania anatomiczne UAM (5) Badanie własności fizycznych i fizykochemicznych IA PAN (6) Procesy fizjologiczne UP Poznań (7), IFR PAN (8, 10), UR Kraków (9, 11, 12) Generowanie i opis zmienności genetycznej IGR PAN (2), UŚ (4, 22) Badanie fenotypowej ekspresji odporności na suszę IGR PAN (2), IUNG-PIB (3), UP Kraków (9) Analiza i integracja wyników doświadczeń IGR PAN (23) Określenie i prognoza warunków środowiskowych IŚRiL PAN (1) Badania transkryptomu IGR PAN (17), UR Kraków (18), UŚ (19), UAM (20) Badania proteomu IChB PAN (13), UAM (14), IGR PAN (21) Badania metabolomu IGR PAN (15), IChB PAN (16) Koordynacja i zarządzanie IGR PAN (24) Przedsiębiorcy firmy hodowlane: DANKO sp. z o.o., PHR sp. z o.o.
4
5 Doświadczenia polowe z populacjami linii jęczmienia T. Adamski, M. Surma, A. Kuczyńska IGR PAN
6 PC2 (18.6%) PC2 (21.6%) Doświadczenia polowe z populacjami linii jęczmienia 3 lata MCam LCam PC1 (64.3%) PC1 (68.2%)
7 PC2 (18.6%) PC2 (21.6%) Doświadczenia polowe z populacjami linii jęczmienia 3 lata MCam LCam PC1 (64.3%) PC1 (68.2%)
8 Doświadczenia szklarniowe z populacjami linii jęczmienia
9 PC2 (15.6%) PC2 (15.3%) Doświadczenia szklarniowe z populacjami linii jęczmienia 3 poziomy czynnika susza PC1 (34.3%) PC1 (35.0%) Figure 2. Principal component biplots, with dots corresponding to LCam recombinant inbred lines observed in drought DI (red), drought DII (yellow) and in control conditions (green), and vectors corresponding to observed traits, made for data obtained in 2012 and 2013.
10 PC2 (15.6%) PC2 (15.3%) Doświadczenia szklarniowe z populacjami linii jęczmienia 3 poziomy czynnika susza PC1 (34.3%) efekt DII > efekt DI PC1 (35.0%) Figure 2. Principal component biplots, with dots corresponding to LCam recombinant inbred lines observed in drought DI (red), drought DII (yellow) and in control conditions (green), and vectors corresponding to observed traits, made for data obtained in 2012 and 2013.
11 Badanie zawartości metabolitów w liściach (metody chromatograficzne) Metabolite number Metabolite name 1 3-Feruloylquinic acid 2 3-p-Coumaroylquinic acid 3 5-Feruloylquinic acid 4 Apigenin 6-C-glucoside-8-C-arabinoside/Apigenin 6-C-arabinoside-8-C-glucoside 5 Apigenin 7-O-arabinosylglucoside 6 Apigenin 7-O-diglucoside 7 Apigenin 7-O-glucosylarabinoside 8 Apigenin 7-O-glucosylrhamnoside 9 Apigenin 7-O-rhamnosylglucoside 10 Blumenol C 2''-O-glucuronylglucoside 11 Blumenol C derivative 12 Blumenol C glucoside 13 Caffeic acid derivative 14 Caffeoyl - hexose 15 Chrysoeriol 7-O-arabinosylglucoside 16 Chrysoeriol 7-O-diglucoside/Isoscoparin 2''-O-glucoside UPLC_UV_signal_ UPLC_UV_signal_ UPLC_UV_signal_ UPLC_UV_signal_ UPLC_UV_signal_ UPLC_UV_signal_111 Piotr Kachlicki, IGR PAN Aneta Sawikowska
12 Badanie zawartości metabolitów w liściach (metody chromatograficzne) susza/kontrola, 2 terminy badania Analiza współrzędnych głównych (PCO, principal coordinate analysis), macierz podobieństw wyliczona z odległości Euklidesowych pomiędzy liniami
13 Badanie zawartości białek w liściach (metoda elektroforezy 2D) Protein number Protein name Number of genotypes in which protein was observed Function like protein homolog 76 Defence 2 2-Cys peroxiredoxin BAS1 67 Defence 3 2-Cys peroxiredoxin BAS1 64 Defence 4 2-Cys peroxiredoxin BAS1, chloroplastic (Fragment) 73 Defence 5 20 kda chaperonin, chloroplastic 83 Defence 6 6-phosphogluconate dehydrogenase 70 Carbon metabolism 7 Actin (Fragment) 84 Other 8 Adenylate kinase 91 Carbon metabolism 9 ADP-glucose pyrophosphorylase small subunit, plastid 87 Carbon metabolism 10 Alanyl-tRNA synthetase 68 Gene expression 11 Aminotransferase 69 Nitrogen metabolism 12 Apocytochrome f 71 Photosynthesis 13 Ascorbate peroxidase 95 Defence 14 Ascorbate peroxidase 74 Defence 15 Ascorbate peroxidase 55 Defence 16 ATP synthase subunit alpha, chloroplastic 65 Ion/electron transport 17 ATP synthase subunit alpha, chloroplastic 59 Ion/electron transport Unknown protein 40 Unknown 254 Unknown protein 39 Unknown 255 Unknown protein 38 Unknown 256 Unknown protein 32 Unknown 257 Unknown protein 21 Unknown Maciej Stobiecki, IChB PAN; niepub.
14 Badanie zawartości białek w liściach (metoda elektroforezy 2D) Analiza współrzędnych głównych dla grup funkcyjnych białek obserwowanych w liniach RIL i formach rodzicielskich. Zielone próby kontrolne, czerwone próby w warunkach niedoboru wody. Liście Korzenie
15 Dane metabolomiczne 135 cech, 4 warianty doświadczalne (termin x susza) Analiza składowych głównych Analiza współrzędnych głównych Principal component analysis - Na podstawie estymowanej macierzy kowariancji (korelacji) cech - Możliwy biplot - Obserwacje brakujące problem - Liczba obserwacji > liczby cech Principal coordinate analysis (Gower 1966) - Na podstawie dowolnej macierzy współcz. podobieństwa pomiędzy obiektami - Szuka rozmieszczenia, w którym - Biplot: NIE - Obserwacje brakujące dopuszczalne - Możliwa dla większej liczby cech
16 Skalowanie wielowymiarowe na podstawie macierzy niepodobieństw stress = stress = Liniowe Linear multidimensional scaling Dopasowanie odległości Euklidesowych w przestrzeni niskowymiarowej do rzeczywistych niepodobieństw za pomocą regresji liniowej Niemetryczne Non-metric multidimensional scaling Dopasowanie odległości Euklidesowych w przestrzeni niskowymiarowej do rzeczywistych niepodobieństw za pomocą regresji monotonicznej stress =
17 Stochastyczne rozmieszczenie sąsiadów wg rozkładu t-studenta Prawdopodobieństwa (podobieństwa) w przestrzeni wysokowymiarowej (z N(x i, σ 2 )) Prawdopodobieństwa (podobieństwa) w przestrzeni niskowymiarowej (z rozkładu t-studenta, df = 1) t-distributed Stochastic Neighbor Embedding Minimalizacja dywergencji Kullbacka-Leiblera (względnej entropii) pomiędzy P i Q (metodą gradientu) van der Maaten L., Hinton G., Visualizing data using t-sne. J. Machine Learning Res. 9 (2008):
18 Stochastyczne rozmieszczenie sąsiadów wg rozkładu t-studenta Prawdopodobieństwa (podobieństwa) w przestrzeni wysokowymiarowej (z N(x i, σ 2 )) Prawdopodobieństwa (podobieństwa) w przestrzeni niskowymiarowej (z rozkładu t-studenta, df = 1) t-distributed Stochastic Neighbor Embedding Minimalizacja dywergencji Kullbacka-Leiblera (względnej entropii) pomiędzy P i Q (metodą gradientu) van der Maaten L., Hinton G., Visualizing data using t-sne. J. Machine Learning Res. 9 (2008):
19 Grupowanie obiektów i cech mapa ciepła (heatmap) Wartości cech: odchylenia (susza kontrola); tylko metabolity wykazujące interakcję linia x traktowanie
20 Grupowanie obiektów /cech AU (Approximately Unbiased) p-value and BP (Bootstrap Probability) value. AU p-value, which is computed by multiscale bootstrap resampling, is a better approximation to unbiased p- value than BP value computed by normal bootstrap resampling. Grupy białek wyznaczone metodą grupowania hierarchicznego na podstawie odległości Euklidesowej, skupienia istotne wyznaczone metodą bootstrap (1000 iteracji, AU > 95%, funkcja pvclust w R)
21 Sieci korelacyjne: wizualizacja struktury korelacji cech Obliczenia: WGCNA (R) Macierze: - korelacji β - TOM topology overlap matrix -Możliwa ocena parametrów sieci: connectivity,... Wizualizacja: Cytoscape Dane: zawartość białek, kolory grupy funkcyjne Aneta Sawikowska
22 Genotypowanie: opis genomu obiektów roślinnych za pomocą dużej liczby zmiennych dyskretnych, tzw. markerów molekularnych CloneID D1 D10 D11 D12 D13 D14 D15 D16 D17 D18 D
23 Genotypowanie: opis genomu obiektów roślinnych za pomocą dużej liczby zmiennych dyskretnych, tzw. markerów molekularnych CloneID AlleleSequence SNP SnpPosition TGCAGCAACAATGCTAACCATCGAATTACACTCCTCTGCTACATGCTACTGGTTCATTCCGAGATCGGA 25:T>C TGCAGATCCCTTCGCTGCTGCGTGCCCATCACCTGCAACGAGCAGAGCAGAGCAAGGAGAGGAGATTAC 40:A>G TGCAGTACACTAGCGAGGACTAAATCTTTGATCTATGACGTACACCACTAACCACTGTACTGCCATTCA 14:G>T TGCAGACTTGTTAAGTTCAGTAGAAAACACATGACAGTCTACCGAGATCGGAAGAGCGGTTCAGCAGGA 18:A>G TGCAGTCCGCACCAAAGAGCTTCACTATCTATGTAAACAGCGTGCAGCTCAAGGCAGCCCACACCAAGT 26:A>G TGCAGTAAACCTTCCCGCCGTGCCCTCCAAACCACCACACAGTCCCTATCCAAAATCCGAGATCGGAAG 12:T>C TGCAGATTTCTCATCATCATATCATACGATAAAAGCTCACAGAGCAGCACACTAGGTTCGGTACCTGCC 42:A>G TGCAGCGAACAAAAATTTCGTTATTTAAAAACAAAATGTCGCTGCACTCGTGTGCACTAGTTAATGAGG 11:A>G TGCAGACAACGAATTGTTATATATGAAGTGGAGCAGAAACTTGAAGACAACAGGCTGCATGTTGTCGAT 54:C>T TGCAGGGTAACCCTGACATTCCCGCACGCTCTGGCAAACTCGCCCTAAAGAGGCAGAGATCGCCGAGAT 28:C>G TGCAGGTTTTTGAGCTCTTGGCCGCACATTACTATCATACCAGTACCGAGATCGGAAGAGCGGTTCAGC 22:C>G TGCAGGGTTGGACGGAGCGCGGAGAGCAAGGCCATGGCATGGCCCTAGCAACTTCTACGGGGATCATCC 13:G>T TGCAGCTTTTTCTGCTCTGTGTTTGTTTAGATCTTGTCGATTGTACTCTGCTATACCGTTCAACCTTTA 9:T>G TGCAGTATTATTAAACAACGACAGCACAGGCATCATGCAGAGACCGAGATCGGAAGAGCGGTTCAGCAG 15:C>A TGCAGGCCTGCATTTCGTCGTGTAAGGTGGTCGATCGATCACCTTTGTGGAACCACGACCGAGATCGGA 16:G>T TGCAGAACTTTAACAGTACGATGGAATGCCAAGCACCAGTGATCACACACGCGAACCAGCTGATCATAT 36:C>G TGCAGATGCACCCTCACAGGCCGCGCAACATCCTGGTCAAGAACAAGAAAAACGGATACGAAACCGAGA 44:A>C TGCAGGTCCCAGCCGCGGCACAGCCCCACGTAGTCCTCCAGGTTGAACGCGCCCACCAGCTCCGCCACC 20:C>G TGCAGCTGCACCATGGATGATGATGGGTGGATTGGCGTCCTGCTCCGAGATCGGAAGAGCGGTTCAGCA 13:T>C TGCAGGATCGCATCGAGGAAACAGCAGCAAGATTTAGGAACCGAGATCGGAAGAGCGGTTCAGCAGGAA 5:G>A TGCAGTAGCAGGTTGTGGTGCATCCCTAGCTTGTTGTACCCTTCCAGGCAGCCGAGATCGGAAGAGCGG 5:T>C TGCAGCTGGAACTCAGTTGGGGTGAGGGCAAGGAAGGCGCTGTTGCATGAATGCTCGTTGTAGTATGTG 14:A>T TGCAGCAACTGCGCGGCCATCGTCTCCGTTACGTGTCGCGACGGAAGGACAGAGACGTGCCGAGATCGG 18:A>G 18
24 PC2, 4.02% Genotypowanie: opis genomu obiektów roślinnych za pomocą dużej liczby zmiennych dyskretnych, tzw. markerów molekularnych Breeding group D OG P S W WR Wizualizacja struktury genetycznej populacji 149 linii żyta za pomocą analizy składowych głównych dla 2330 markerów SNP DartSeq PC1, 4.43% Rakoczy-Trojanowska i in., Plant Mol Biol Rep 35 (2017):
25 Obiekty roślinne (linie, odmiany,...) Omika : analiza wielowymiarowa dla roślin Genome (markery, sekwencje) Proteome Metabolome... Phenome
26 Obiekty roślinne (linie, odmiany,...) Omika : analiza wielowymiarowa dla roślin Genome (markery, sekwencje) Proteome Metabolome... Phenome
27 Przerwa
28 Analiza danych funkcjonalnych Projekt Marie Curie ITN SYSFLO
29 Analiza modyfikacji histonowych Sygnał modyfikacji histonu (np. metylacji) Ilościowy sygnał z wielu komórek o różnym stanie modyfikacji nt Promotor Miejsce początku transkrypcji Gen HHHHMMHMHMMMHHMMHMMMMHMMMMMMMHHHHHHHHHHHHHMM Histon (białko) H normalne /M modyfikowane
30 Analiza modyfikacji histonowych Sygnał modyfikacji histonu (np. metylacji) Ilościowy sygnał z wielu komórek o różnym stanie modyfikacji nt Promotor Miejsce początku transkrypcji Wiele genów HHHHMMHMHMMMHHMMHMMMMHMMMMMMMHHHHHHHHHHHHHMM Histon (białko) H normalne /M modyfikowane
31 Funkcjonalne składowe główne Analiza składowych głównych - obserwowana p-wymiarowa zmienna losowa x o macierzy kowariancji V, składowe główne wyznaczane są poprzez rozwiązanie równania: współrzędne punktów w PC to iloczyny skalarne Funkcjonalna analiza składowych głównych obserwowana funkcja losowa x(t), funkcja kowariancyjna v(s, t), składowe główne wyznaczane są z równania które można zapisać używając operatora kowariancji jako Współrzędne funkcjonalne (FPC) to Rozwiązanie numeryczne porze przybliżenie obserwacji i funkcji własnych za pomocą zbioru funkcji bazowych, np. typu spline.
32 10 obserwacji funkcji Estymowane funkcje własne ekstrema funkcji odpowiadają przedziałom największej zmienności między obserwacjami Położenie 10 obserwacji w układzie pierwszej, drugiej i trzeciej funkcjonalnej składowej głównej.
33 Profile trzech modyfikacji histonowych dla genów człowieka kodujących białka (dane: mapepigenomics.org/
34 współczynniki korelacji współrzędnych Pierwsze trzy funkcje własne dla trzech modyfikacji histonowych Wyliczono współczynniki korelacji pomiędzy współrzędnymi punktów i pomiędzy funkcjami własnymi dla 5 pierwszych FPC dla me1, me2 i me3 współczynniki korelacji funkcji własnych
35 Podsumowanie Eksploracja v. testowanie hipotez Metody deterministyczne v. zrandomizowane Różne metody różne wyniki? Narzędzia Obliczenia: Genstat, R Wizualizacja: Genstat, R, Cytoscape Sprzęt: PC, klastry PCSS Dziękuję za uwagę
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
Metoda największej wiarygodności
Rozdział Metoda największej wiarygodności Ogólnie w procesie estymacji na podstawie prób x i (każde x i może być wektorem) wyznaczamy parametr λ (w ogólnym przypadku również wektor) opisujący domniemany
Wykład 10 Skalowanie wielowymiarowe
Wykład 10 Skalowanie wielowymiarowe Wrocław, 30.05.2018r Skalowanie wielowymiarowe (Multidimensional Scaling (MDS)) Główne cele MDS: przedstawienie struktury badanych obiektów przez określenie treści wymiarów
Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak
Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin Henryk Bujak e-mail: h.bujak@ihar.edu.pl Ocena różnorodności fenotypowej Różnorodność fenotypowa kolekcji roślinnych zasobów
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1
CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1 PRACOWNIA INFORMATYCZNA PROWADZĄCY: Dr Magda Mielczarek (biolog) Katedra Genetyki, pokój nr 21
Skalowanie wielowymiarowe idea
Skalowanie wielowymiarowe idea Jedną z wad metody PCA jest możliwość używania jedynie zmiennych ilościowych, kolejnym konieczność posiadania pełnych danych z doświadczenia(nie da się użyć PCA jeśli mamy
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa
BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji
Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka
Analiza współzależności zjawisk dr Marta Kuc-Czarnecka Wprowadzenie Prawidłowości statystyczne mają swoje przyczyny, w związku z tym dla poznania całokształtu badanego zjawiska potrzebna jest analiza z
Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
Komputerowa Analiza Danych Doświadczalnych
Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11, środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Prawdopodobieństwo i statystyka
Wykład XV: Zagadnienia redukcji wymiaru danych 2 lutego 2015 r. Standaryzacja danych Standaryzacja danych Własności macierzy korelacji Definicja Niech X będzie zmienną losową o skończonym drugim momencie.
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZA 1. Wykład wstępny. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. ajczęściej wykorzystywane testy statystyczne
Modelowanie danych hodowlanych
Modelowanie danych hodowlanych 1. Wykład wstępny. Algebra macierzowa 3. Wykorzystanie różnych źródeł informacji w predykcji wartości hodowlanej 4. Kowariancja genetyczna pomiędzy spokrewnionymi osobnikami
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
Idea. Analiza składowych głównych Analiza czynnikowa Skalowanie wielowymiarowe Analiza korespondencji Wykresy obrazkowe.
Idea (ang. Principal Components Analysis PCA) jest popularnym używanym narzędziem analizy danych. Na metodę tę można spojrzeć jak na pewną technikę redukcji wymiarowości danych. Jest to metoda nieparametryczna,
PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI
PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki - projekt 3. Charakterystyka przedmiotu 4. Kontakt 5. Literatura Copyright 2017 Joanna Szyda KATEDRA
STATYSTYKA MATEMATYCZNA WYKŁAD 1
STATYSTYKA MATEMATYCZNA WYKŁAD 1 Wykład wstępny Teoria prawdopodobieństwa Magda Mielczarek wykłady, ćwiczenia Copyright 2017, J. Szyda & M. Mielczarek STATYSTYKA MATEMATYCZNA? ASHG 2011 Writing Workshop;
Statystyka SYLABUS A. Informacje ogólne
Statystyka SYLABUS A. Informacje ogólne Elementy składowe sylabusu Nazwa jednostki prowadzącej kierunek Nazwa kierunku studiów Poziom kształcenia Profil studiów Forma studiów Kod Język Rodzaj Dziedzina
Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2
ALEKSANDRA ŚWIERCZ Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2 Ekspresja genów http://genome.wellcome.ac.uk/doc_wtd020757.html A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH
Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania
Analiza skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania Analiza Skupień Elementy składowe procesu grupowania obiekt Ekstrakcja cech Sprzężenie zwrotne Grupowanie klastry Reprezentacja
Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii
Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii 1. Technologia rekombinowanego DNA jest podstawą uzyskiwania genetycznie zmodyfikowanych organizmów 2. Medycyna i ochrona zdrowia
Badania asocjacyjne w skali genomu (GWAS)
Badania asocjacyjne w skali genomu (GWAS) Część 2 LD, PCA Bioinżynieria, I mgr Bioinformatyczna analiza danych Wykład 3 Dr Wioleta Drobik-Czwarno Katedra Genetyki i Ogólnej Hodowli Zwierząt Analiza głównych
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
SYLABUS DOTYCZY CYKLU KSZTAŁCENIA
SYLABUS DOTYCZY CYKLU KSZTAŁCENIA 2015-2021 1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE Nazwa przedmiotu/ modułu Techniki biologii molekularnej Kod przedmiotu/ modułu* Wydział (nazwa jednostki prowadzącej
1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test
Analiza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Statystyka i eksploracja danych
Wykład XII: Zagadnienia redukcji wymiaru danych 12 maja 2014 Definicja Niech X będzie zmienną losową o skończonym drugim momencie. Standaryzacją zmiennej X nazywamy zmienną losową Z = X EX Var (X ). Definicja
4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74
3 Wykaz najważniejszych skrótów...8 Przedmowa... 10 1. Podstawowe pojęcia data mining...11 1.1. Wprowadzenie...12 1.2. Podstawowe zadania eksploracji danych...13 1.3. Główne etapy eksploracji danych...15
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Jaki koń jest nie każdy widzi - genomika populacji polskich ras koni
Jaki koń jest nie każdy widzi - genomika populacji polskich ras koni Gurgul A., Jasielczuk I., Semik-Gurgul E., Pawlina-Tyszko K., Szmatoła T., Bugno-Poniewierska M. Instytut Zootechniki PIB Zakład Biologii
ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x
ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Eksploracja danych. Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Grupowanie wykład 1
Grupowanie Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Grupowanie wykład 1 Sformułowanie problemu Dany jest zbiór obiektów (rekordów). Znajdź naturalne pogrupowanie
Specjalność (studia II stopnia) Oczyszczanie i analiza produktów biotechnologicznych
Specjalność (studia II stopnia) Oczyszczanie i analiza produktów biotechnologicznych Studia magisterskie przedmioty specjalizacyjne Bioinformatyka w analizie genomu Diagnostyka molekularna Elementy biosyntezy
Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla
Bogumiła Koprowska Elżbieta Kukla 1 Wstęp Czym są efekty losowe? Przykłady Model mieszany 2 Estymacja Jednokierunkowa klasyfikacja (ANOVA) Metoda największej wiarogodności (ML) Metoda największej wiarogodności
SPIS TEŚCI CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA
SPIS TEŚCI PRZEDMOWA...13 CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA 1. ZDARZENIA LOSOWE I PRAWDOPODOBIEŃSTWO...17 1.1. UWAGI WSTĘPNE... 17 1.2. ZDARZENIA LOSOWE... 17 1.3. RELACJE MIĘDZY ZDARZENIAMI... 18 1.4.
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4
KARTA KURSU (do zastosowania w roku ak. 2015/16) Nazwa Statystyka 1 Nazwa w j. ang. Statistics 1 Kod Punktacja ECTS* 4 Koordynator Dr hab. Tadeusz Sozański (koordynator, wykłady) Dr Paweł Walawender (ćwiczenia)
Analiza składowych głównych idea
Analiza składowych głównych idea Analiza składowych głównych jest najczęściej używanym narzędziem eksploracyjnej analizy danych. Na metodę tę można spojrzeć jak na pewną technikę redukcji wymiarowości
1. KEGG 2. GO. 3. Klastry
ANALIZA DANYCH 1. Wykład wstępny 2. Charakterystyka danych 3. Analiza wstępna genomiczna charakterystyka cech 4. Prezentacje grup roboczych analiza wstępna 5. Prezentacje grup roboczych analiza wstępna
SPOTKANIE 9: Metody redukcji wymiarów
Wrocław University of Technology SPOTKANIE 9: Metody redukcji wymiarów Piotr Klukowski* Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.wroc.pl 08.12.2015 *Część slajdów pochodzi z prezentacji dr
X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9
Zadanie W celu sprawdzenia, czy pipeta jest obarczona błędem systematycznym stałym lub zmiennym wykonano szereg pomiarów przy różnych ustawieniach pipety. Wyznacz równanie regresji liniowej, które pozwoli
Przykładowa analiza danych
Przykładowa analiza danych W analizie wykorzystano dane pochodzące z publicznego repozytorium ArrayExpress udostępnionego na stronach Europejskiego Instytutu Bioinformatyki (http://www.ebi.ac.uk/). Zbiór
Ocena interakcji genotypu i środowiska w doświadczeniu proweniencyjno - rodowym z sosną zwyczajną IBL Jan Kowalczyk IBL
Ocena interakcji genotypu i środowiska w doświadczeniu proweniencyjno - rodowym z sosną zwyczajną IBL 2004 Jan Kowalczyk IBL Interakcja GxE Zachodzi wtedy gdy reakcja genotypów jest różna w różnych środowiskach
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski
Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:
STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA
STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA Zadanie 0.1 Zmienna losowa X ma rozkład określony funkcją prawdopodobieństwa: x k 0 4 p k 1/3 1/6 1/ obliczyć EX, D X. (odp. 4/3;
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZE W BIOLOGII 1. Wykład wstępny. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. ajczęściej wykorzystywane testy statystyczne
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
1. Analiza asocjacyjna. Cechy ciągłe. Cechy binarne. Analiza sprzężeń. Runs of homozygosity. Signatures of selection
BIOINFORMATYKA 1. Wykład wstępny 2. Bazy danych: projektowanie i struktura 3. Równowaga Hardyego-Weinberga, wsp. rekombinacji 4. Analiza asocjacyjna 5. Analiza asocjacyjna 6. Sekwencjonowanie nowej generacji
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2
Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2 Dr hab. inż. Agnieszka Wyłomańska Faculty of Pure and Applied Mathematics Hugo Steinhaus Center Wrocław University of Science and
Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ
Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Statystyczna analiza danych
Statystyczna analiza danych ukryte modele Markowa, zastosowania Anna Gambin Instytut Informatyki Uniwersytet Warszawski plan na dziś Ukryte modele Markowa w praktyce modelowania rodzin białek multiuliniowienia
Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka
Wstęp do obsługi biologicznych baz danych i analizy porównawczej białek i genów Katedra Fizjologii i Biotechnologii Roślin Pok. 113 CB jan.jastrzebski@uwm.edu.pl bioinformatyka@gmail.com www.ebiology.net
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Idea. Analiza składowych głównych Analiza czynnikowa Skalowanie wielowymiarowe Analiza korespondencji Wykresy obrazkowe.
Idea (ang. principal components analysis PCA), zwana również dekompozycją według wartości osobliwych (SVD) lub dekompozycją spektralną, jest popularną techniką redukcji wymiarowości danych(liczby cech).
Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii
Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii 1. Transgeneza - genetycznie zmodyfikowane oraganizmy 2. Medycyna i ochrona zdrowia 3. Genomika poznawanie genomów Przełom XX i
KORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb
Współzależność Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb (x i, y i ). Geometrycznie taką parę
ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI
ANALIZA DANYCH POCHODZĄCYCH Z SEKWENCJONOWANIA NASTĘPNEJ GENERACJI Joanna Szyda Magdalena Frąszczak Magda Mielczarek WSTĘP 1. Katedra Genetyki 2. Pracownia biostatystyki 3. Projekty NGS 4. Charakterystyka
SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ MAGDALENA FRĄSZCZAK
SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ Prowadzący: JOANNA SZYDA MAGDALENA FRĄSZCZAK WSTĘP 1. Systemy informatyczne w hodowli -??? 2. Katedra Genetyki 3. Pracownia biostatystyki - wykorzystanie narzędzi
CLUSTERING. Metody grupowania danych
CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means
Agnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.
Analizy wielkoskalowe w badaniach chromatyny
Analizy wielkoskalowe w badaniach chromatyny Analizy wielkoskalowe wykorzystujące mikromacierze DNA Genotypowanie: zróżnicowane wewnątrz genów RNA Komórka eukariotyczna Ekspresja genów: Które geny? Poziom
WYKŁAD 8 ANALIZA REGRESJI
WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej
października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II
10 października 2013: Elementarz biologii molekularnej www.bioalgorithms.info Wykład nr 2 BIOINFORMATYKA rok II Komórka: strukturalna i funkcjonalne jednostka organizmu żywego Jądro komórkowe: chroniona
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Wybrane techniki badania białek -proteomika funkcjonalna
Wybrane techniki badania białek -proteomika funkcjonalna Proteomika: umożliwia badanie zestawu wszystkich (lub prawie wszystkich) białek komórkowych Zalety analizy proteomu np. w porównaniu z analizą trankryptomu:
CECHY ILOŚCIOWE PARAMETRY GENETYCZNE
CECHY ILOŚCIOWE PARAMETRY GENETYCZNE Zarządzanie populacjami zwierząt, ćwiczenia V Dr Wioleta Drobik Rodzaje cech Jakościowe o prostym dziedziczeniu uwarunkowane zwykle przez kilka genów Słaba podatność
Algorytmy genetyczne. Paweł Cieśla. 8 stycznia 2009
Algorytmy genetyczne Paweł Cieśla 8 stycznia 2009 Genetyka - nauka o dziedziczeniu cech pomiędzy pokoleniami. Geny są czynnikami, które decydują o wyglądzie, zachowaniu, rozmnażaniu każdego żywego organizmu.
Zastosowanie nowych technologii genotypowania w nowoczesnej hodowli i bankach genów
Zastosowanie nowych technologii genotypowania w nowoczesnej hodowli i bankach genów Jerzy H. Czembor, Bogusław Łapiński, Aleksandra Pietrusińska, Urszula Piechota Krajowe Centrum Roślinnych Zasobów Genowych
Możliwości i potencjalne zastosowania Zintegrowanego Systemu Analitycznego do innowacyjnych i kompleksowych badań molekularnych
Możliwości i potencjalne zastosowania Zintegrowanego Systemu Analitycznego do innowacyjnych i kompleksowych badań molekularnych Dzień Otwarty Klastra LifeScience 31 maj 2017, Kraków dr Agata Piestrzyńska-Kajtoch,
Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Wprowadzenie do modelowania ekonometrycznego Estymator Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 1 Estymator 1 / 16 Agenda 1 Literatura Zaliczenie przedmiotu 2 Model
Ekonometryczne modele nieliniowe
Ekonometryczne modele nieliniowe Wykład 10 Modele przełącznikowe Markowa Literatura P.H.Franses, D. van Dijk (2000) Non-linear time series models in empirical finance, Cambridge University Press. R. Breuning,
Algorytmy metaheurystyczne Wykład 11. Piotr Syga
Algorytmy metaheurystyczne Wykład 11 Piotr Syga 22.05.2017 Drzewa decyzyjne Idea Cel Na podstawie przesłanek (typowo zbiory rozmyte) oraz zbioru wartości w danych testowych, w oparciu o wybrane miary,
Ekonometria. Zajęcia
Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)
Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34
Statystyka Wykład 9 Magdalena Alama-Bućko 24 kwietnia 2017 Magdalena Alama-Bućko Statystyka 24 kwietnia 2017 1 / 34 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38
Statystyka Wykład 8 Magdalena Alama-Bućko 23 kwietnia 2017 Magdalena Alama-Bućko Statystyka 23 kwietnia 2017 1 / 38 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
WYKŁAD 2. Problem regresji - modele liniowe
Wrocław University of Technology WYKŁAD 2 Problem regresji - modele liniowe Maciej Zięba Politechnika Wrocławska Regresja Regresja (ang. Regression): Dysponujemy obserwacjami z odpowiadającymi im wartościami
Prawdopodobieństwo i statystyka r.
Zadanie. Niech (X, Y) ) będzie dwuwymiarową zmienną losową, o wartości oczekiwanej (μ, μ, wariancji każdej ze współrzędnych równej σ oraz kowariancji równej X Y ρσ. Staramy się obserwować niezależne realizacje
STATYSTYKA I DOŚWIADCZALNICTWO
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 9 Analiza skupień wielowymiarowa klasyfikacja obiektów Metoda, a właściwie to zbiór metod pozwalających na grupowanie obiektów pod względem wielu cech jednocześnie.
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Weryfikacja hipotez statystycznych testy t Studenta
Weryfikacja hipotez statystycznych testy t Studenta JERZY STEFANOWSKI Marek Kubiak Instytut Informatyki Politechnika Poznańska Standardowy schemat postępowania (znane σ) Założenia: X ma rozkład normalny