Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak

Podobne dokumenty
STATYSTYKA I DOŚWIADCZALNICTWO

Ocena wartości hodowlanej. Dr Agnieszka Suchecka

STATYSTYKA I DOŚWIADCZALNICTWO

Hierarchiczna analiza skupień

Elementy statystyki STA - Wykład 5

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Analiza składowych głównych. Wprowadzenie

Monitorowanie i Diagnostyka w Systemach Sterowania na studiach II stopnia specjalności: Systemy Sterowania i Podejmowania Decyzji

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

CECHY ILOŚCIOWE PARAMETRY GENETYCZNE

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka i Analiza Danych

Matematyka i statystyka matematyczna dla rolników w SGGW

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Metody Statystyczne. Metody Statystyczne.

Wielowymiarowe metody statystyczne w badaniach cech morfologicznych żyta ozimego

Zarządzanie populacjami zwierząt. Parametry genetyczne cech

Analiza wariancji. dr Janusz Górczyński

Analizy wariancji ANOVA (analysis of variance)

Szacowanie wartości hodowlanej. Zarządzanie populacjami

Statystyka i Analiza Danych

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

PDF created with FinePrint pdffactory Pro trial version

Statystyka matematyczna i ekonometria

Przykład 1. (A. Łomnicki)

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

STATYSTYKA MATEMATYCZNA

Ocena interakcji genotypu i środowiska w doświadczeniu proweniencyjno - rodowym z sosną zwyczajną IBL Jan Kowalczyk IBL

Prawdopodobieństwo i statystyka

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

, a ilość poziomów czynnika A., b ilość poziomów czynnika B. gdzie

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Statystyka i eksploracja danych

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

1 Podstawy rachunku prawdopodobieństwa

Modelowanie danych hodowlanych

Rozdział 8. Regresja. Definiowanie modelu

W1. Wprowadzenie. Statystyka opisowa

Idea. Algorytm zachłanny Algorytmy hierarchiczne Metoda K-średnich Metoda hierarchiczna, a niehierarchiczna. Analiza skupień

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

METODY STATYSTYCZNE W BIOLOGII

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

STATYSTYKA MATEMATYCZNA

Definicja. Odziedziczalność. Definicja. w potocznym rozumieniu znaczy tyle co dziedziczenie. Fenotyp( P)=Genotyp(G)+Środowisko(E) V P = V G + V E

Testy post-hoc. Wrocław, 6 czerwca 2016

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

Dziedziczenie poligenowe

Testowanie hipotez statystycznych.

Analiza wariancji, część 2

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

Wykład 5 Teoria eksperymentu

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

STATYSTYKA MATEMATYCZNA

Metoda największej wiarygodności

Rozkłady statystyk z próby

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

Elementy statystyki wielowymiarowej

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Z poprzedniego wykładu

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Opis wykonanych badań naukowych oraz uzyskanych wyników

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Estymacja parametrów rozkładu cechy

Analiza składowych głównych

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Wykład 6 Teoria eksperymentu

Komputerowa Analiza Danych Doświadczalnych

Przykład 2. Stopa bezrobocia

Rozkłady statystyk z próby. Statystyka

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Weryfikacja hipotez statystycznych

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

INFORMATYKA W SELEKCJI

STATYSTYKA I DOŚWIADCZALNICTWO

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Testowanie hipotez statystycznych.

Stanisław Cichocki. Natalia Nehrebecka

Regresja i Korelacja

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

Zarządzanie populacjami zwierząt. Ocena wartości hodowlanej Wykład 7

Transkrypt:

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin Henryk Bujak e-mail: h.bujak@ihar.edu.pl

Ocena różnorodności fenotypowej Różnorodność fenotypowa kolekcji roślinnych zasobów genowych jest oceniana dla: cech ilościowych ciągłych, cech skokowych quasi ciągłych (z licznym, skończonym, zbiorem wartości), cech skokowych. Dane do analizy różnorodności fenotypowej mogą pochodzić: z obserwacji wielu roślin w obrębie obiektów w jednym lub wielu latach (głównie z kolekcji in situ), z doświadczeń polowych wykonanych w jednym środowisku (miejscowości, roku) - kolekcje ex situ, z serii doświadczeń polowych w wielu środowiskach (latach, miejscowości, kombinacji miejscowości i lat) - kolekcje ex situ.

DANE DO PRAWIDŁOWEGO WNIOSKOWANIA STATYSTYCZNGO doświadczenia polowe w jednym środowisku układ całkowicie losowy losowane bloki bloki niekompletne układ wzorcowy seria doświadczeń j/w pojedyncze doświadczenia w każdym środowisku mogą być zakładane w jednym powtórzeniu

CELE BADANIA RÓŻNORODNOŚCI W KOLEKCJI ROŚLINNYCH ZASOBÓW GENOWYCH W OBRĘBIE JEDNEGO GATUNKU 1) ocena zmienności obiektów ze względu na różne cechy oraz ich uwarunkowanie genetyczne i środowiskowe, 2) wielocechowa klasyfikacja obiektów, 3) ocena zróżnicowania między obiektami i wydzielonymi grupami obiektów.

Jednocechowa analiza różnorodności Wartość fenotypowa (P) osobnika dla cechy: P = G + E gdzie: G wartość genotypowa osobnika, E efekt środowiska.

Jednocechowa analiza różnorodności MODELE ANALIZY WARIANCJI (ANOVA) Model analizy wariancji dla danych z doświadczenia pojedynczego (w jednym środowisku) w układzie całkowicie losowym lub z obserwacji obiektów in situ na jednostkach (roślinach):

Jednocechowa analiza różnorodności MODELE ANALIZY WARIANCJI (ANOVA) Model analizy wariancji dla doświadczenia założonego w układzie blokowym (losowane bloki, bloki niekompletne):

Jednocechowa analiza różnorodności MODELE ANALIZY WARIANCJI (ANOVA) Model analizy wariancji dla doświadczenia założonego w układzie blokowym (losowane bloki, bloki niekompletne): x ij = m + g i + r j + ε ij gdzie: x ij obserwacja cechy dla i tego obiektu na j tej jednostce roślinie, polektu, m średnia ogólna, g i efekt genotypowy i tego obiektu, g i + ε ij = G i wartosć genotypowa i tego obiektu, r j efekt j tego bloku, ε ij reszta, czyli błąd losowy.

Jednocechowa analiza różnorodności MODELE ANALIZY WARIANCJI (ANOVA) Model analizy wariancji dla doświadczeń w układzie blokowym w wielu środowiskach (lata, miejscowości, kombinacje miejscowości w roku): x ijk = m + e k + r(e) jk + g i + ge ik + ε ijk gdzie: x ijk obserwacja cechy dla i tego obiektu w k tym środwisku na j tej jednostce polektu, m średnia ogólna, e k efekt k tego środowiska, r(e) jk efektj tego bloku w k tym środowisku, g i efekt genotypowy i tego obiektu, g i + ε ij = G i wartosć genotypowa i tego obiektu, ge ik efekt interakcji i tego obiektu z k tym środowiskiem, ε ij reszta, czyli błąd losowy, bład doswiadczalny.

Jednocechowa analiza różnorodności MODELE ANALIZY WARIANCJI (ANOVA) Estymacja komponentów wariancyjnych: Zmienność Między obiektami Wewnątrz obiektów (Błąd) Liczba stopni swobody Suma kwadratów (SS) Całkowita n-1 G Średni kwadrat (MS) Oczekiwane średnie kwadraty k-1 T MS o r g + e n-k E MS e e k - liczba obiektów (i= 1,..., k), r liczba powtórzeń (j= 1,..., r), n = kr

Jednocechowa analiza różnorodności MIARA POWTARZALNOŚCI ŚREDNICH OBIEKTOWYCH Odziedziczalność w wąskim sensie dla obiektów ocenianych w jednym środowisku h 2 = σ g 2 σ g 2 + σ ε 2 n Odziedziczalność w wąskim sensie dla obiektów ocenianych w serii doświadczeń w J środowiskach i w n powtórzeniach h 2 = σ g 2 σ g 2 + σ ge 2 J + σ ε 2 nj

Wielocechowa analiza różnorodności ANALIZA SKUPIEŃ 1. Grupowanie obiektów za pomocą analizy skupień: Standaryzacja danych Z = x m σ ~ N(0,1) gdzie: x wartość obserwacji m wartość oczekiwana (średnia) σ odchylenie standardowe Miary wielocechowego zróżnicowania obiektów: odległość euklidesowa, kwadrat odległości euklidesowej, odległość Mahalanobisa.

Wielocechowa analiza różnorodności ANALIZA SKUPIEŃ 1. Grupowanie obiektów za pomocą analizy skupień: Metody grupowania obiektów: metody hierarchiczne metoda średniej odległości między obiektami w skupieniu (UPMGA). metoda Warda, metody niehierarchiczne Kryteria statystycznego wnioskowania o zróżnicowaniu skupień: sposób arbitralny np. 70/30% lub 75/25% kryteria obiektywizujące statystyka pseudo F statystyka pseudo t 2

ANALIZA SKUPIEŃ 1. Grupowanie obiektów za pomocą analizy skupień: Wielocechowa analiza różnorodności C_91 C_93 C_80 C_56 C_26 C_92 C_88 C_94 C_76 C_77 C_64 C_42 C_35 C_79 C_90 C_58 C_89 C_87 C_84 C_55 C_57 C_33 C_29 C_71 C_72 C_34 C_25 C_52 C_67 C_36 C_49 C_32 C_73 C_61 C_86 C_23 C_2 C_62 C_22 C_68 C_45 C_10 C_6 C_39 C_8 C_60 C_40 C_78 C_50 C_59 C_54 C_38 C_24 C_5 C_28 C_19 C_46 C_9 C_7 C_27 C_16 C_82 C_85 C_74 C_20 C_37 C_21 C_11 C_65 C_83 C_81 C_75 C_63 C_66 C_53 C_44 C_4 C_15 C_43 C_18 C_17 C_47 C_30 C_51 C_14 C_69 C_48 C_31 C_41 C_13 C_12 C_3 C_70 C_1 0 10 20 30 40 50 60 70 80 Odległość wiązania

Wielocechowa analiza różnorodności ANALIZA ZRÓZNICOWANIA OBIEKTÓW 2. Analiza zróżnicowania i relacji obiektów oraz wydzielonych grup obiektów: 2.1. Analiza składowych głównych Tworzenie wzajemnie nieskorelowanych liniowych funkcji oryginalnych (składowych głównych), z których, pierwsza, druga, trzecia, wyjaśniają największą możliwą część wielocechowej zmienności badanych obiektów. Wyjaśnia zmienność odległości euklidesowych pomiędzy obiektami. Pozwala wykryć wzajemne współzmienności (korelacje) cech w obrębie danego zbioru obiektów. Wykres (biplot) obrazuje relacje wielocechowe obiektów.

Wielocechowa analiza różnorodności ANALIZA ZRÓZNICOWANIA OBIEKTÓW 2. Analiza zróżnicowania i relacji obiektów oraz wydzielonych grup obiektów: 2.1. Analiza składowych głównych PC2 [13,66%] 4 2 33 0-2 26 44 396 28 41 3542 19 9 8 14 16 48 27 40 18 22 10 7 2113 11 23 24 78 434 57 5 12 29 25 2050 36 52 37 647 38 1751 82 63 15 74 59 61 62 60 31 49 72 83 86 54 75 85 79 53 77 45 70 73 32 81 84 46 3 55 68 69 1 65 90 30 67 71 466 76 58 94 89 87 88 80 93 91 92 56-4 2-6 -6-4 -2 0 2 4 6 8 PC1 [28,73%]

Wielocechowa analiza różnorodności ANALIZA ZRÓZNICOWANIA OBIEKTÓW 2. Analiza zróżnicowania i relacji obiektów oraz wydzielonych grup obiektów: 2.2. Analiza zmiennych kanonicznych Tworzenie wzajemnie nieskorelowanych liniowych funkcji cech oryginalnych (zmiennych kanonicznych), z których pierwsza, druga, trzecia, wyjaśniają największą możliwą część ogólnej zmienności odległości Mahalanobisa między pierwotnymi (oryginalnymi) obiektami lub ich wtórnymi zbiorowiskami. Wykrycie cech, które mają największą moc dyskryminacyjną (są najważniejsze) w zróżnicowaniu grup obiektów w kolekcji. Ilustracja zmienności odległości Mahalanobisa między obiektami.

DZIĘKUJĘ ZA UWAGĘ