Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin Henryk Bujak e-mail: h.bujak@ihar.edu.pl
Ocena różnorodności fenotypowej Różnorodność fenotypowa kolekcji roślinnych zasobów genowych jest oceniana dla: cech ilościowych ciągłych, cech skokowych quasi ciągłych (z licznym, skończonym, zbiorem wartości), cech skokowych. Dane do analizy różnorodności fenotypowej mogą pochodzić: z obserwacji wielu roślin w obrębie obiektów w jednym lub wielu latach (głównie z kolekcji in situ), z doświadczeń polowych wykonanych w jednym środowisku (miejscowości, roku) - kolekcje ex situ, z serii doświadczeń polowych w wielu środowiskach (latach, miejscowości, kombinacji miejscowości i lat) - kolekcje ex situ.
DANE DO PRAWIDŁOWEGO WNIOSKOWANIA STATYSTYCZNGO doświadczenia polowe w jednym środowisku układ całkowicie losowy losowane bloki bloki niekompletne układ wzorcowy seria doświadczeń j/w pojedyncze doświadczenia w każdym środowisku mogą być zakładane w jednym powtórzeniu
CELE BADANIA RÓŻNORODNOŚCI W KOLEKCJI ROŚLINNYCH ZASOBÓW GENOWYCH W OBRĘBIE JEDNEGO GATUNKU 1) ocena zmienności obiektów ze względu na różne cechy oraz ich uwarunkowanie genetyczne i środowiskowe, 2) wielocechowa klasyfikacja obiektów, 3) ocena zróżnicowania między obiektami i wydzielonymi grupami obiektów.
Jednocechowa analiza różnorodności Wartość fenotypowa (P) osobnika dla cechy: P = G + E gdzie: G wartość genotypowa osobnika, E efekt środowiska.
Jednocechowa analiza różnorodności MODELE ANALIZY WARIANCJI (ANOVA) Model analizy wariancji dla danych z doświadczenia pojedynczego (w jednym środowisku) w układzie całkowicie losowym lub z obserwacji obiektów in situ na jednostkach (roślinach):
Jednocechowa analiza różnorodności MODELE ANALIZY WARIANCJI (ANOVA) Model analizy wariancji dla doświadczenia założonego w układzie blokowym (losowane bloki, bloki niekompletne):
Jednocechowa analiza różnorodności MODELE ANALIZY WARIANCJI (ANOVA) Model analizy wariancji dla doświadczenia założonego w układzie blokowym (losowane bloki, bloki niekompletne): x ij = m + g i + r j + ε ij gdzie: x ij obserwacja cechy dla i tego obiektu na j tej jednostce roślinie, polektu, m średnia ogólna, g i efekt genotypowy i tego obiektu, g i + ε ij = G i wartosć genotypowa i tego obiektu, r j efekt j tego bloku, ε ij reszta, czyli błąd losowy.
Jednocechowa analiza różnorodności MODELE ANALIZY WARIANCJI (ANOVA) Model analizy wariancji dla doświadczeń w układzie blokowym w wielu środowiskach (lata, miejscowości, kombinacje miejscowości w roku): x ijk = m + e k + r(e) jk + g i + ge ik + ε ijk gdzie: x ijk obserwacja cechy dla i tego obiektu w k tym środwisku na j tej jednostce polektu, m średnia ogólna, e k efekt k tego środowiska, r(e) jk efektj tego bloku w k tym środowisku, g i efekt genotypowy i tego obiektu, g i + ε ij = G i wartosć genotypowa i tego obiektu, ge ik efekt interakcji i tego obiektu z k tym środowiskiem, ε ij reszta, czyli błąd losowy, bład doswiadczalny.
Jednocechowa analiza różnorodności MODELE ANALIZY WARIANCJI (ANOVA) Estymacja komponentów wariancyjnych: Zmienność Między obiektami Wewnątrz obiektów (Błąd) Liczba stopni swobody Suma kwadratów (SS) Całkowita n-1 G Średni kwadrat (MS) Oczekiwane średnie kwadraty k-1 T MS o r g + e n-k E MS e e k - liczba obiektów (i= 1,..., k), r liczba powtórzeń (j= 1,..., r), n = kr
Jednocechowa analiza różnorodności MIARA POWTARZALNOŚCI ŚREDNICH OBIEKTOWYCH Odziedziczalność w wąskim sensie dla obiektów ocenianych w jednym środowisku h 2 = σ g 2 σ g 2 + σ ε 2 n Odziedziczalność w wąskim sensie dla obiektów ocenianych w serii doświadczeń w J środowiskach i w n powtórzeniach h 2 = σ g 2 σ g 2 + σ ge 2 J + σ ε 2 nj
Wielocechowa analiza różnorodności ANALIZA SKUPIEŃ 1. Grupowanie obiektów za pomocą analizy skupień: Standaryzacja danych Z = x m σ ~ N(0,1) gdzie: x wartość obserwacji m wartość oczekiwana (średnia) σ odchylenie standardowe Miary wielocechowego zróżnicowania obiektów: odległość euklidesowa, kwadrat odległości euklidesowej, odległość Mahalanobisa.
Wielocechowa analiza różnorodności ANALIZA SKUPIEŃ 1. Grupowanie obiektów za pomocą analizy skupień: Metody grupowania obiektów: metody hierarchiczne metoda średniej odległości między obiektami w skupieniu (UPMGA). metoda Warda, metody niehierarchiczne Kryteria statystycznego wnioskowania o zróżnicowaniu skupień: sposób arbitralny np. 70/30% lub 75/25% kryteria obiektywizujące statystyka pseudo F statystyka pseudo t 2
ANALIZA SKUPIEŃ 1. Grupowanie obiektów za pomocą analizy skupień: Wielocechowa analiza różnorodności C_91 C_93 C_80 C_56 C_26 C_92 C_88 C_94 C_76 C_77 C_64 C_42 C_35 C_79 C_90 C_58 C_89 C_87 C_84 C_55 C_57 C_33 C_29 C_71 C_72 C_34 C_25 C_52 C_67 C_36 C_49 C_32 C_73 C_61 C_86 C_23 C_2 C_62 C_22 C_68 C_45 C_10 C_6 C_39 C_8 C_60 C_40 C_78 C_50 C_59 C_54 C_38 C_24 C_5 C_28 C_19 C_46 C_9 C_7 C_27 C_16 C_82 C_85 C_74 C_20 C_37 C_21 C_11 C_65 C_83 C_81 C_75 C_63 C_66 C_53 C_44 C_4 C_15 C_43 C_18 C_17 C_47 C_30 C_51 C_14 C_69 C_48 C_31 C_41 C_13 C_12 C_3 C_70 C_1 0 10 20 30 40 50 60 70 80 Odległość wiązania
Wielocechowa analiza różnorodności ANALIZA ZRÓZNICOWANIA OBIEKTÓW 2. Analiza zróżnicowania i relacji obiektów oraz wydzielonych grup obiektów: 2.1. Analiza składowych głównych Tworzenie wzajemnie nieskorelowanych liniowych funkcji oryginalnych (składowych głównych), z których, pierwsza, druga, trzecia, wyjaśniają największą możliwą część wielocechowej zmienności badanych obiektów. Wyjaśnia zmienność odległości euklidesowych pomiędzy obiektami. Pozwala wykryć wzajemne współzmienności (korelacje) cech w obrębie danego zbioru obiektów. Wykres (biplot) obrazuje relacje wielocechowe obiektów.
Wielocechowa analiza różnorodności ANALIZA ZRÓZNICOWANIA OBIEKTÓW 2. Analiza zróżnicowania i relacji obiektów oraz wydzielonych grup obiektów: 2.1. Analiza składowych głównych PC2 [13,66%] 4 2 33 0-2 26 44 396 28 41 3542 19 9 8 14 16 48 27 40 18 22 10 7 2113 11 23 24 78 434 57 5 12 29 25 2050 36 52 37 647 38 1751 82 63 15 74 59 61 62 60 31 49 72 83 86 54 75 85 79 53 77 45 70 73 32 81 84 46 3 55 68 69 1 65 90 30 67 71 466 76 58 94 89 87 88 80 93 91 92 56-4 2-6 -6-4 -2 0 2 4 6 8 PC1 [28,73%]
Wielocechowa analiza różnorodności ANALIZA ZRÓZNICOWANIA OBIEKTÓW 2. Analiza zróżnicowania i relacji obiektów oraz wydzielonych grup obiektów: 2.2. Analiza zmiennych kanonicznych Tworzenie wzajemnie nieskorelowanych liniowych funkcji cech oryginalnych (zmiennych kanonicznych), z których pierwsza, druga, trzecia, wyjaśniają największą możliwą część ogólnej zmienności odległości Mahalanobisa między pierwotnymi (oryginalnymi) obiektami lub ich wtórnymi zbiorowiskami. Wykrycie cech, które mają największą moc dyskryminacyjną (są najważniejsze) w zróżnicowaniu grup obiektów w kolekcji. Ilustracja zmienności odległości Mahalanobisa między obiektami.
DZIĘKUJĘ ZA UWAGĘ