ZESZYTY PROBLEMOWE POSTĘPÓW NAUK ROLNICZYCH 2007 z. 517: 767-774 WIELOWYMIAROWA OCENA ZMIENNOŚCI FENOTYPOWEJ W KOLEKCJI ZASOBÓW GENOWYCH PSZENśYTA JAREGO Krzysztof Ukalski Ukalska 1 1, Wanda Kociuba 2, Wiesław Mądry 1, Joanna 1 Katedra Biometrii, Szkoła Główna Gospodarstwa Wiejskiego w Warszawie 2 Instytut Genetyki, Hodowli i Biotechnologii Roślin, Akademia Rolnicza w Lublinie Wstęp Ocena zmienności cech w kolekcjach zasobów genowych jest waŝnym aspektem badawczym, niezwykle pomocnym w zarządzaniu kolekcjami oraz wykorzystaniu ich w hodowli. Charakterystyka zmienności genotypów kolekcyjnych ma na celu, po pierwsze - stworzenie podstaw do sposobu prowadzenia i organizacji kolekcji. Po drugie, badanie zmienności genotypów, analiza ich podobieństwa i niepodobieństwa, są niezbędne przy ocenie ich przydatności jako materiału wyjściowego w hodowli roślin. Postęp w hodowli nowych odmian pszenŝyta wiąŝe się między innymi z tym, iŝ hodowcy duŝą uwagę skupiają na doborze form rodzicielskich do krzyŝowania. Zatem konieczne jest zabezpieczenie nowych i starych genotypów, jako źródeł zmienności, które mogą być wykorzystywane w przyszłych pracach hodowlanych i badawczych. Metodami pozwalającymi na porównanie obiektów kolekcyjnych pod względem wielu cech, jak równieŝ ogólnej oceny ich zmienności są: metody klasyfikacyjne (analiza skupień Cluster Analysis) i porządkujące (analiza składowych głównych Principal Component Analysis) [MOHAMMADI, PRASANNA 2003; CROSSA, FRANCO 2004]. Metody te charakteryzują się komplementarnością ich wykorzystania. Zwykle, jako pierwszą, stosuje się analizę składowych głównych po to, by syntetycznie pokazać zmienność poprzez znalezienie cech mających największy udział w wielocechowej zmienności w badanym aspekcie. Następnie dokonuje się grupowania obiektów podobnych, ze względu na wszystkie badane cechy, za pomocą hierarchicznej analizy skupień [FLORES i in. 1997; UPADHYAYA i in. 2005]. Celem pracy jest analiza zmienności 75 genotypów w kolekcji pszenŝyta jarego pod względem 7 cech uŝytkowych, za pomocą analizy składowych głównych (PCA) oraz wydzielenie grup genotypów podobnych wielocechowo za pomocą hierarchicznej analizy skupień (CA). Opis kolekcji Materiał i metody Materiał badawczy stanowiła część kolekcji genotypów pszenŝyta jarego prowadzona przez Instytut Genetyki i Hodowli Roślin Akademii Rolniczej w Lu-
768 K. Ukalski i inni blinie. Składają się na nią odmiany zarejestrowane, jak i odmiany skreślane z rejestru oraz wartościowe materiały genetyczne otrzymane w placówkach hodowlanych i badawczych. Materiały włączane do badań kolekcyjnych pochodzą z krajowych i zagranicznych ośrodków hodowli oraz światowych banków genów. Mają one równieŝ na celu zabezpieczenie zasobów genowych rodzaju Triticosecale WITTMACK. Waloryzacja prowadzona jest w 4-letnim cyklu jednopowtórzeniowych doświadczeń polowych. W niniejszej pracy wykorzystano wyniki doświadczeń z lat 1996-1999. Spośród obserwowanych w badaniach cech, do analizy wybrano 7 waŝnych cech rolniczych: długość kłosa, liczba ziarn w kłosie, masa 1000 ziarn (MTZ), płodność kłoska, wysokość roślin, liczba dni wschody-kłoszenie oraz liczba dni wschody-dojrzałość. Analiza statystyczna Zebrane dane doświadczalne dla kaŝdej cechy stanowiły dwukierunkową, kompletną klasyfikację krzyŝową o postaci genotypy lata z jedną obserwacją w podklasie. Oddzielnie dla kaŝdej cechy przeprowadzono jednowymiarową analizę statystyczną sklasyfikowanych obserwacji na podstawie następującego modelu losowego postaci [MĄDRY 1993; XU i in. 2006]: y ij = m + g i + r j + e ij, (1) gdzie: y ij jest obserwacją rozpatrywanej odrębnie cechy u i-tego genotypu (i = 1,...,a) w j-tym roku (j=1,...,b), m jest średnią ogólną, g i jest losowym efektem głównym i-tego genotypu, r j jest losowym efektem środowiskowym j-tego roku, e ij jest losowym efektem, złoŝonym z błędu doświadczalnego i efektu interakcji genotypowo-środowiskowej dla i-tego genotypu oraz j-tego roku. Na podstawie modelu (1) wykonano analizy wariancji, testując hipotezy o braku zmienności (tzn. o zerowej wariancji) efektów genotypowych i efektów środowiskowych lat [MĄDRY 1993]. Komponenty wariancyjne dla efektów modelu (1) estymowano metodą REML. Losowe efekty główne genotypów oszacowano za pomocą najlepszego liniowego nieobciąŝonego predyktora BLUP [HENDERSON 1977; SEARLE 1987; LITTELL i in. 1996]. Pomimo Ŝe analizowany układ doświadczalny dla kaŝdej z badanych cech stanowi klasyfikację kompletną, zastosowano estymatory BLUP, gdyŝ dla losowych efektów czynnikowych mają one mniejszą wariancję, niŝ estymatory najmniejszych kwadratów (BLUE). Estymatory BLUP wartości genotypowych wykorzystano dalej w stosowanych metodach wielowymiarowych [COOPER i in. 2001; BERTERO i in. 2004; XU i in. 2006]. Rozpatrywane genotypy podzielono za pomocą hierarchicznej analizy skupień na grupy zawierające obiekty o duŝym podobieństwie wielocechowym. Zastosowano metodę aglomeracji zaproponowaną przez WARDA [1963], w której jako miarę podobieństwa między genotypami wykorzystano kwadrat odległości euklidesowej, obliczanej na podstawie wartości BLUP-ów dla badanych cech
WIELOWYMIAROWA OCENA ZMIENNOŚCI FENOTYPOWEJ... 769 w skali standaryzowanej dla kaŝdej z nich [KRZANOWSKI 1988; GUTIÉRREZ i in. 2003; MOHAMMADI, PRASANNA 2003]. Metoda Warda analizy skupień jest uznana jako efektywna w grupowaniu obiektów o relatywnie duŝym podobieństwie w obrębie grup, z racji na umiarkowanie określoną odległość między skupieniami w trakcie procesu aglomeracji. Jest wiec ona często uŝywana w badaniach klasyfikacyjnych obiektów zasobów genowych roślin. Wartości pierwszych dwóch składowych głównych wykorzystano do przybliŝonego przedstawienia w przestrzeni dwuwymiarowej podobieństwa obiektów, wyraŝonego w kategoriach kwadratu odległości euklidesowej dla 7 standaryzowanych wartości obserwowanych cech. Wszystkie obliczenia oraz prezentowane w pracy wykresy zostały wykonane przy uŝyciu procedur pakietu statystycznego SAS, tj. MIXED (wyznaczenie wartości BLUP-ów), PRINCOMP (PCA) i CLUSTER (CA) [LITTELL i in. 1996; KHATTREE, NAIK 2000; SAS/STAT User's Guide 2002]. Wyniki i dyskusja
770 K. Ukalski i inni Dwie pierwsze składowe główne wyjaśniły 68,72% łącznej zmienności średnich genotypowych (BLUP-ów) rozwaŝanych cech u genotypów w badanej kolekcji, przy czym pierwsza składowa główna wyjaśniła 42,47% łącznej zmienności BLUP-ów genotypowych, natomiast druga składowa wyjaśniła 26,25% tej zmienności. Dość duŝe wartości dodatnie współczynnika korelacji pierwszej składowej głównej stwierdzono z wysokością roślin (r = 0,51), natomiast ujemnie składowa ta była skorelowana z liczbą ziarn w kłosie (r = -0,42). Zatem genotypy wysokie charakteryzują się małą liczbą ziarn w kłosie. Druga składowa była silnie skorelowana dodatnio z liczbą ziarn w kłosie (r = 0,89) oraz z masą tysiąca ziarn (r = 0,69). Cechy silnie skorelowane z dwoma pierwszymi składowymi głównymi identyfikują wspólne czynniki genetyczne, warunkujące te cechy. Za pomocą hierarchicznej analizy skupień podzielono 75 badanych genotypów pszenŝyta jarego na 6 grup podobnych pod względem badanych cech fenotypowych. W tabeli 2 przedstawiony jest podział obiektów kolekcyjnych na grupy. Wyodrębnione grupy charakteryzują się róŝną liczebnością - od 6 do 18 genotypów. Tabela 2; Table 2 Grupy genotypów pszenŝyta jarego wydzielone za pomocą analizy skupień metodą Warda Groups of triticale genotypes divided by Ward s hierarchical clustering method Grupy Groups Liczebnoś ć Count Genotypy Genotypes 1 13 63365 CURRENCY; ARARUNA; BEAGLE; BGL; BORBA; CT 775.81/3/2 * MUS X/LYN X// YOGUI; FAHAD 5; JUANILLO; LAMB 1/RHINO 3; LAMB 2; NIMIR 3/ERIZO 12; PERLA 5-1; WIR 46058/GNU/1//ERIZO 11 2 18 274/320//BGL/3/MUSX/LYNX /4 RHINO; ANOAS 3/TATU 4; AROI 1/TOPO 1419//ERIZO; ARRUDA; ASNO/ARDI 3// ERIZO 7; CAAL; CAGUAN 3; CRATO; Erizo 11 * 2 MILAN; ERIZO 11 * 2/BAU; ERIZO 11/YOGUT 3; HARE; MIGO; MORSA; PAPION 4; PASSI 3-2; SUSI 2 3 18 ARDI 1/TOPC 1419//ERIZO 9; ASAD/ELK 54// ERIZO 10; CANN; DAGRO/I BEX//CIVET 2; DAGRO/IBEX//CIVET#2; DELFIN; GABO; MAH 1093; MAH 1293; MAH-1395; MAH-1495; MAJA; NIMIR 1/HARE 265/ERIZO 9; PTF-8512; RONDO 2 * ERIZO 11; RONDO/BANT 5// ANOAS 2; RONDO/BANT 5//ANOAS 2; TTE 9302; 959; 11T; 41750 1; 41758 9; 41759 10; 41760 11; 41761 12; 41764 15 4 13 959; 11T; 41750 1; 41758 9; 41759 10; 41760 11; 41761 12; 41764 15; 41766 17; 41769 20; 6TA-201; 6TA-271; 6TA-313 5 6 [Inia-Rye]2ARM"S"48DC-66; 41751 2; 41754 5; 42-71 ARMADILLA x 308-6y 2M-100V-6B-O; KOALA"S"113DG-11776; NAVOJOA 6 7 ARABIN; ARANCARIA; BACUM; BATOVI; BR-2; GEN; PTF-8710
WIELOWYMIAROWA OCENA ZMIENNOŚCI FENOTYPOWEJ... 771 Rys. 1. Fig. 1. Rozmieszczenie 75 genotypów pszenŝyta jarego w przestrzeni dwóch pierwszych składowych głównych PCA1 i PCA2 (kaŝdy genotyp reprezentowany jest przez numer grupy, do której został przyporządkowany) Scatter plot of 75 triticale genotypes in the first two principal components dimensions PCA1 and PCA2 (each genotype is shown as a number of group to which it was allocated) Na rysunku 1 przedstawiono rozmieszczenie badanych genotypów w układzie dwóch pierwszych składowych głównych. W ten sposób zobrazowano graficznie w dwóch wymiarach, przybliŝone podobieństwo 7-cechowe między genotypami, określone za pomocą odległości euklidesowej cech standaryzowanych. Stopień przybliŝenia odległości euklidesowych między obiektami w dwóch wymiarach składowych głównych jest dobry, poniewaŝ jego miarą jest ponad 68-procentowa część zmienności wielocechowej obiektów, wyjaśniona przez dwie pierwsze składowe główne. Ze względu na wyraz interpretacyjny dwóch pierwszych składowych głównych, rysunek 1 obrazuje podobieństwo obiektów głównie pod względem cech najsilniej skorelowanych z
772 K. Ukalski i inni dwiema pierwszymi składowymi, a więc wysokości roślin i liczby ziarn w kłosie (1 składowa), a takŝe liczby ziarn w kłosie i MTZ (2 składowa). Znaczna część genotypów przyjmuje wartości bliskie średnim dwóch pierwszych składowych (grupy 3 i 5). MoŜna zauwaŝyć, Ŝe w badanej kolekcji przewaŝają genotypy o niskiej i średniej wysokości roślin (grupy 1, 2, 3, 6), które charakteryzują się duŝą liczbą ziarn w kłosie i wysoką masą 1000 ziarn (grupy 1, 2, 3). Grupa 4 to genotypy wysokie o małej liczbie ziarn w kłosie, ale charakteryzujące się duŝą MTZ, czyli są to genotypy o duŝych ziarniakach. Natomiast grupa 6 to genotypy niskie o przeciętnej liczbie ziarn w kłosie i jednocześnie małej MTZ. Wnioski 1. Analiza składowych głównych pozwoliła na uproszczone, wystarczająco dokładne, przedstawienie wielocechowej zmienności fenotypowej pszenŝyta jarego w badanej kolekcji. Wykazała istnienie dwóch czynników wpływających na kształtowanie się 7 badanych cech pszenŝyta. Pierwszy czynnik warunkuje głównie wysokość roślin i liczbę ziarn kłosie, a drugi liczbę ziarn w kłosie i masę tysiąca ziarn. 2. Zastosowana metoda podziału badanych 75 genotypów pszenŝyta, oparta na hierarchicznej analizie skupień metodą Warda, w której jako miarę podobieństwa uŝyto kwadratu odległości euklidesowej wartości BLUP-ów dla genotypów, pozwoliła wydzielić 6 grup jednorodnych pod względem siedmiu cech rolniczych. Stwierdzono istotne, wielocechowe róŝnice średnich wartości badanych cech pomiędzy grupami. 3. Obydwie zastosowane metody wielowymiarowe, tj. analiza składowych głównych i analiza skupień dostarczyły komplementarnych informacji przydatnych do oceny zmienności fenotypowej w badanej kolekcji zasobów genowych i wykorzystania ich w hodowli. Literatura BERTERO H.D., DE LA VEGA A.J., CORREA G., JACOBSEN S.E., MUJICA A. 2004. Genotype and genotype-by-environment interaction effects for grain yield and grain size of quinoa (Chenopodium quinoa Willd.) as revealed by pattern analysis of international multi-environment trials. Field Crops Research 89: 299-318. COOPER M., WOODRUFF D.R., PHILLIPS I.G., BASFORD K.E., GILMOUR A.R. 2001. Genotype-by-management interactions for grain yield and grain protein concentration of wheat. Field Crops Research 69: 47-67. CROSSA J., FRANCO J. 2004. Statistical methods for classifying genotypes. Euphytica 137: 19-37. FLORES F., GUTIERREZ J.C., LOPEZ J., MORENO M.T., CUBERTO J.I. 1997. Multivariate analysis approach to evaluate a germplasm collection of Hedysarum coronarium L. Genetic Resources and Crop Evolution 44: 545-555. GUTIÉRREZ L., FRANCO J., CROSSA J., ABADIE T. 2003. Comparing a preliminary racial classification with a numerical classification of the maize landraces of Uruguay.
WIELOWYMIAROWA OCENA ZMIENNOŚCI FENOTYPOWEJ... 773 Crop Sci. 43: 718-727. HENDERSON C.R. 1977. Best linear unbiased estimation and prediction under a selection model. Biometrics 31: 423-447. KHATTREE R., NAIK D.N. 2000. Multivariate data reduction and discrimination with SAS software. SAS Institute Inc., Cary, NC: 558 ss. KRZANOWSKI W.J. 1988. Principles of multivariate analysis: a users s perspective. Oxford University Press, Oxford: 563 ss. LITTELL R.C., MILLIKEN G.A., STROUP W.W., WOLFINGER R.D. 1996. SAS system for mixed models. SAS Institute Inc., Cary, NC: 633 ss. MĄDRY W. 1993. Studia statystyczne nad wielowymiarową oceną zróŝnicowania cech ilościowych w kolekcjach zasobów genowych zbóŝ. Monografie i Rozprawy, Wydawnictwo SGGW: 108 ss. MOHAMMADI S.A., PRASANNA B.M. 2003. Analysis of genetic diversity in crop plants - Salient statistical tools and considerations. Crop Sci. 43: 1235-1248. SAS/STAT User's Guide, Version 8.2. 2002. SAS Institute, Cary NC (online). SEARLE S.R. 1987. Linear models for unbalanced data. J. Wiley & Sons, New York: 536 ss. UPADHYAYA H.D., MALLIKARJUNA SWAMY B.P., KENCHANA GOUDAR P.V., KULLAISWAMY B.Y., SINGH S. 2005. Identification of diverse groundnut germplasm through multienvironment evaluation of a core collection for Asia. Field Crops Research 93: 293-299. WARD J.H., JR. 1963. Hierarchical grouping to optimize an objective function. J. Am. Statist. Assoc. 58: 236-244. XU H., MEI H., HU J., ZHU J., GONG P. 2006. Sampling a core collection of Island cotton (Gossypium barbadense L.) based on the genotypic values of fiber traits. Genetic Resources and Crop Evolution 53: 515-521. Słowa kluczowe: analiza składowych głównych, hierarchiczna analiza skupień, zasoby genowe, pszenŝyto jare, zmienność fenotypowa Streszczenie W pracy przeprowadzono statystyczną analizę zmienności fenotypowej w obrębie kolekcji pszenŝyta jarego pochodzącej z Instytutu Genetyki i Hodowli Roślin Akademii Rolniczej w Lublinie. Analizowano 7 waŝnych cech rolniczych. Obserwacje pochodziły z czterech lat badań 1996 1999, tworząc kompletną klasyfikację genotypy lata. Dla kaŝdej cechy oszacowano komponenty wariancyjne za pomocą metody REML na podstawie losowego modelu ANOVA dla tej klasyfikacji. Oceny wartości genotypowych wyznaczono za pomocą najlepszego nieobciąŝonego predyktora (BLUP). Na ich podstawie wykonano analizę składowych głównych dla wszystkich badanych cech oraz dokonano podziału genotypów kolekcyjnych na 6 grup podobnych pod względem badanych cech. Stwierdzono największe wartości dodatnie współczynnika
774 K. Ukalski i inni korelacji pierwszej składowej głównej z wysokością roślin oraz ujemne z liczbą ziarn w kłosie. Druga składowa główna była silnie dodatnio skorelowana z liczbą ziarn w kłosie i masą tysiąca ziarn. MULTIVARIATE PHENOTYPIC DIVERSITY IN SPRING TRITICALE GERMPLASM COLLECTION Krzysztof Ukalski 1, Wanda Kociuba 2, Wiesław Mądry 1, Joanna Ukalska 1 1 Department of Biometrics, Warsaw Agricultural University, Warszawa 2 Institute of Genetics, Breeding and Plant Biotechnology, Agricultural University, Lublin Key words: cluster analysis, principal component analysis, germplasm collection, spring triticale, phenotypic variation Summary Phenotypic variation among 75 genotypes (cultivars and clones) in triticale collection from the Institute of Genetics and Plant Breeding in Lublin was assessed using two multivariate methods of principal component analysis (PCA) and hierarchical cluster analysis (CA). The variation was studied for seven traits. Data were collected in a trial carried out over four years (1996-1999). They were arranged in complete two-way classification genotypes by years. Variance components were estimated for each trait separately using REML method for a random ANOVA model of the two-way classification. Estimates of genotypic values were obtained using the best linear unbiased predictor (BLUP). The highest values of correlation coefficients were obtained between the first principal component (PC), plant height (positive) and the number of grains per spike (negative). The second PC was strongly positively correlated with the number of grains per spike, and 1000-grain weight. All genotypes were grouped into six clusters. Dr Krzysztof Ukalski Katedra Biometrii Szkoła Główna Gospodarstwa Wiejskiego ul. Nowoursynowska 159 02-776 WARSZAWA e-mail: krzysztof.ukalski@agrobiol.sggw.waw.pl