Wykorzystanie wielowymiarowych metod statystycznych do badania bioróżnorodności jodły pospolitej Abies alba Mill

Podobne dokumenty
WYKORZYSTANIE METODY K-ŚREDNICH W TAKSONOMII PORTFELA AKCJI

STATYSTYKA I DOŚWIADCZALNICTWO

Rys. 1. Chromatogram i sposób pomiaru podstawowych wielkości chromatograficznych

Hierarchiczna analiza skupień

Instrukcja do ćwiczeń laboratoryjnych

Elementy statystyki wielowymiarowej

STATYSTYKA I DOŚWIADCZALNICTWO

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak

Kreacja aromatów. Techniki przygotowania próbek. Identyfikacja składników. Wybór składników. Kreacja aromatu

Instrukcja do ćwiczeń laboratoryjnych

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

Ilościowa analiza mieszaniny alkoholi techniką GC/FID

Ćwiczenie 1 Analiza jakościowa w chromatografii gazowej Wstęp

Identyfikacja węglowodorów aromatycznych techniką GC-MS

ANALIZA STRUKTURY WIEKOWEJ ORAZ PŁCIOWEJ CZŁONKÓW OFE Z WYKORZYSTANIEM METOD TAKSONOMICZNYCH

V Kongres Browarników, października 2015, Ustroń

ANALIZA LOTNYCH ZWIĄZKÓW ORGANICZNYCH WYDZIELANYCH DO ATMOSFERY PRZEZ ROŚLINY METODĄ GC-MS

CHROMATOGRAFIA CHROMATOGRAFIA GAZOWA

Formularz opisu kursu (sylabus przedmiotu) na rok akademicki 2011/2010

ANALIZA ŚLADOWYCH ZANIECZYSZCZEŃ ŚRODOWISKA I ROK OŚ II. OznaczanieBTEX i n-alkanów w wodzie zanieczyszczonej benzyną metodą GC/FID oraz GC/MS 1

Jakościowa i ilościowa analiza mieszaniny alkoholi techniką chromatografii gazowej

Zagadnienie klasyfikacji (dyskryminacji)

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Statystyczna analiza poziomu rozwoju społeczno-gospodarczego w Polsce - w ujęciu regionalnym

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

Analiza składowych głównych

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska

Czym jest analiza skupień?

W1. Wprowadzenie. Statystyka opisowa

Naszym zadaniem jest rozpatrzenie związków między wierszami macierzy reprezentującej poziomy ekspresji poszczególnych genów.

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

Jakościowe i ilościowe oznaczanie alkoholi techniką chromatografii gazowej

Analiza zatrudnienia w nowej UE z wykorzystaniem FPCA. Uniwersytet Rzeszowski Ćwiklińskiej 2, Rzeszów

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Analiza współzależności zjawisk

Współczynniki korelacji czastkowej i wielorakiej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

Grupowanie Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633

Zespół autorski: Alicja Sowińska, Iwona Skrzecz, Radosław Plewa, Wojciech Janiszewski ZAKŁAD OCHRONY LASU, IBL

OFERTA TEMATÓW PROJEKTÓW DYPLOMOWYCH (MAGISTERSKICH) do zrealizowania w Katedrze INŻYNIERII CHEMICZNEJ I PROCESOWEJ

Wielowymiarowe metody statystyczne w badaniach cech morfologicznych żyta ozimego

Metoda największej wiarygodności

Czym różni się sosna od sosny?

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

Statystyka matematyczna dla kierunku Rolnictwo w SGGW. BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH. ANALIZA KORELACJI PROSTEJ.

Idea. Algorytm zachłanny Algorytmy hierarchiczne Metoda K-średnich Metoda hierarchiczna, a niehierarchiczna. Analiza skupień

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Konkurs Matematyka z Przyrodą dla uczniów szkół podstawowych rok szkolny 2006/2007 etap szkolny

Zjawisko dopasowania w sytuacji komunikacyjnej. Patrycja Świeczkowska Michał Woźny

Taksonomia numeryczna co to jest?

Analiza składowych głównych. Wprowadzenie

Techniki immunochemiczne. opierają się na specyficznych oddziaływaniach między antygenami a przeciwciałami

Zależność cech (wersja 1.01)

ANALIZA LOTNYCH ZWIĄZKÓW ORGANICZNYCH WYDZIELANYCH DO ATMOSFERY PRZEZ ROŚLINY METODĄ GC-MS

Instrukcja do ćwiczeń laboratoryjnych

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Klasyfikacja województw według ich konkurencyjności przy pomocy metod taksonomicznych oraz sieci neuronowych.

OPTYMALIZACJA EFEKTÓW ROZDZIELANIA W KOLUMNACH KAPILARNYCH DOBÓR PRĘDKOŚCI PRZEPŁYWU GAZU

CHROMATOGRAFIA II 18. ANALIZA ILOŚCIOWA METODĄ KALIBRACJI

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Inteligentna analiza danych

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Proces badania statystycznego z wykorzystaniem miernika syntetycznego (wg procedury Z. Zioło)

Instrukcja do ćwiczeń laboratoryjnych

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Zadania ze statystyki cz.8. Zadanie 1.

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO

Wykład 10 Zrandomizowany plan blokowy

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Metody Statystyczne. Metody Statystyczne

Analiza wariancji i kowariancji

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO STATYSTYCZNA ANALIZA ZMIAN LICZBY HOTELI W POLSCE W LATACH

Optymalizacja wielokryterialna

Szacowanie wartości hodowlanej. Zarządzanie populacjami

WYKŁAD 9 METODY ZMIENNEJ METRYKI

WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH:

Regresja i Korelacja

Prawdopodobieństwo i rozkład normalny cd.

TEMAT: WPROWADZANIE ROŚLIN ZIELARSKICH DO UPRAW EKOLOGICZNYCH

CECHY ILOŚCIOWE PARAMETRY GENETYCZNE

SPECYFIKACJA TECHNICZNA ZESTAWU DO ANALIZY TERMOGRAWIMETRYCZNEJ TG-FITR-GCMS ZAŁĄCZNIK NR 1 DO ZAPYTANIA OFERTOWEGO

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

OZNACZENIE JAKOŚCIOWE I ILOŚCIOWE w HPLC

Testowanie hipotez statystycznych.

Wnioskowanie statystyczne. Statystyka w 5

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium IX: Analiza skupień

PDF created with FinePrint pdffactory Pro trial version

Ćwiczenie ELE. Jacek Grela, Łukasz Marciniak 3 grudnia Rys.1 Schemat wzmacniacza ładunkowego.

Wielowymiarowa analiza poziomu ubóstwa powiatów województwa podlaskiego Multivariate Analysis of the Poverty of the Podlaskie Province Districts

Transkrypt:

Wykorzystanie wielowymiarowych metod statystycznych do badania bioróżnorodności jodły pospolitej Abies alba Mill Szymon Baran, Danuta Kalemba Robert Pietrzykowski, Wojciech Zieliński Streszczenie Praca dotyczy analizy chemotypów jodły pospolitej. Badanymi cechami były następujące związki chemiczne: santen, tricyklen, α-pinen, kamfen, β-pinen, β-mircen, β-felandren, terpinolen, borneol, octan bornylu. W wyniku zastosowania trzech metod statystycznych uzyskano potwierdzenie występowania bioróżnorodności drzew jodły pospolitej ze względu na wybrane składniki lotne w obrębie badanej populacji. W pracy zastosowano: analizę składowych głównych, analizę skupień oraz analizę k-średnich. 1. Wstęp Polimorfizm chemiczny to zjawisko szeroko rozpowszechnione w świecie roślin, w tym w roślinach olejkodajnych. Polega ono na występowaniu różnych składników w roślinach tego samego gatunku, a różnice mogą dotyczyć składu ilościowego i jakościowego. Często określone chemotypy występują w różnych populacjach, ale bywa, że w jednej populacji rośnie kilka odmian chemicznych gatunku. W badaniach bioróżnorodności wewnątrzgatunkowej w roślinach olejkodajnych wykorzystuje się głównie analizę olejku eterycznego otrzymanego przez destylację z parą wodną surowca. W ostatnich latach ta czasochłonna metoda jest zastępowana przez nową szybką metodę polegająca na analizie związków lotnych w fazie nadpowierzchniowej za pomocą mikroekstrakcji do fazy stałej (HS-SPME) [Pawliszyn, 1997]. W pracy zastosowano trzy metody statystyczne: analizę składowych głównych, analizę skupień i metodę k-średnich w celu uzyskania podziału obiektów (drzew) z jednej populacji jodły pospolitej na grupy ze względu na skład olejku eterycznego. Następnie porównano podziały uzyskane wymienionymi metodami. 2. Materiał doświadczalny i analiza chemiczna Materiał doświadczalny stanowiły igły jodły pospolitej Abies alba Mill. z populacji rosnącej w okolicach Oleśnicy. Do analizy pobrano igły z jednorocznych przyrostów z dziesięciu drzew oznaczonych jako SP 1, SP 2, SP 3,..., SP 10. Badanymi cechami były następujące związki chemiczne: santen, tricyklen, α-pinen, kamfen, β-pinen, β-mircen, β-felandren, terpinolen, borneol, octan bornylu. Wyżej wymienione cechy uzyskiwano następującymi metodami: HS-SPME: próbki igieł o masie 2 g umieszczano w 30 ml zamkniętym naczyniu, do którego wprowadzano pokrytą adsorbentem (PDMS) igłę mikrostrzykawki. Po 30 minutach igłę przenoszono do dozownika chromatografu gazowego (GC) i chromatografu gazowego sprzężonego ze spektrometrem masowym (GC-MS), gdzie następowała desorpcja składników i ich rozdział na kolumnie. GC: aparat Carlo Erba Instruments MEGA 5300, detektor FID, kolumna kapilarna CP Sil 5 CB, 30 m 0.32 mm, grubość filmu 0.25 µm; temperatura 50-300 C, przyrost 4 C/min, temperatura dozownika 320 C, temperatura detektora 310 C, prędkość przepływu azotu 1.0 ml/min. GC-MS: aparat Fisons GC 8000 sprzężony z MD 800, kolumna i warunki jak w GC; gaz nośny hel, 0.8 ml/min.; energia jonizacji 70 ev, temperatura źródła jonów 200 C. Składniki lotne były identyfikowane przez porównanie ich indeksów retencji i widm masowych z wzorcami, a ich względne zawartości odczytywano z analizy GC. 3. Metody statystyczne W pracy wykorzystano trzy wielowymiarowe metody statystyczne: analizę składowych głównych (PCA), analizę skupień, w tym metodę k-średnich. Analiza składowych głównych jest ogólnie znaną metodą statystyczną. Jej dokładny opis można znaleźć u Krzyśki (2000), Morisona (1990) i wielu innych autorów. Ta wielowymiarowa metoda statystyczna może służyć do redukcji danych, interpretacji zależności pomiędzy zmiennymi oraz interpretacji struktury zbioru obserwacji. Zastosowanie tej metody statystycznej można znaleźć w wielu pracach (Pietrzykowski i in. 1999, Rezzi i in. 2001). 1

Kolejną wykorzystywaną metodą była metoda analizy skupień. W jej wyniku otrzymano podział obserwowanych obiektów na rozłączne grupy. Techniki analizy skupień można podzielić na dwie kategorie: metody aglomeracyjne oraz podziałowe. Techniki aglomeracyjne polegają na tworzeniu grup poprzez dołączanie do już istniejących grup kolejnych obiektów. Wynik działania tych technik prezentowany jest przeważnie w postaci dendrogramu. Odpowiednie przecięcie gałęzi takiego dendrogramu powoduje rozpadniecie się powstałego drzewa na rozłączne grupy (Falniowski 2003). Jednym z problemów analizy skupień jest wybranie odpowiedniej miary odległości i techniki podziału. Najogólniejszą metrykąjest metryka Minkowskiego o postaci: 1/p m d ik = x ij x kj, j=1 gdzie p jest liczbą określającą rodzaj metryki, m jest liczbą cech, zaś x ij, x kj są realizacjami j-tej cechy odpowiednio w i-tym oraz k-tym obiekcie (Pociecha i in. 1998). Wykorzystując tą metrykę można określić inne znane metryki: miejską (Manhattan distance, p = 1), euklidesową (Euclidean distance, p = 2) i inne. Jeżeli chodzi o techniki podziału, to najczęściej stosowane są metody najdalszego i najbliższego sąsiedztwa. Podział obiektów w analizie skupień jest arbitralny i nie ma jasnych wytycznych jak podzielić obserwowane obiekty na skupienia. Metody podziałowe polegają na dzieleniu całego zbioru obiektów zgodnie z ogólną zasadą maksymalizacji wariancji pomiędzy poszczególnymi grupami, przy jednoczesnej minimalizacji wariancji wewnątrz badanych grup. W wyniku stosowania metod z tej grupy jest wskazanie skupień w badanym zbiorze obiektów. Przykładem takiej techniki jest metoda k-średnich zaproponowana przez MacQueena (MacQueen 1967). W metodzie k-średnich X 1, X 2,..., X n są zaobserwowanymi obiektami p cechowymi, to znaczy X i = (X il,..., X ip ), gdzie i = l,..., n. Założono, że obiekty pochodzą z pewnej nieznanej liczby k populacji. Na podstawie zebranych danych identyfikowano liczbę k oraz przydzielono posiadane obiekty do poszczególnych populacji. Jeżeli przez J = {I i,..., I k } oznaczymy podział zbioru {1,..., n} na k rozłącznych podzbiorów, a liczby w zbiorze I i będziemy traktować jako numery obserwowanych obiektów pochodzących z pierwszej populacji, liczby w zbiorze I 2 jako numery obiektów z drugiej populacji, itd. Zakładając, że liczba k populacji jest ustalona będziemy szukać najlepszego podziału. Jako kryterium określenia wyboru najlepszego podziału wybrano ten podział, dla którego zróżnicowanie międzygrupowe w stosunku do zróżnicowania wewnątrzgrupowego będzie największe. Jako miernik zróżnicowania międzygrupowego przyjęto: SA J = 1 k k XIi X J 2, zaś miernikiem zróżnicowania wewnątrzgrupowego będzie: gdzie X J = 1 k SE J = 1 k k k X Ii, XIi = 1 k i 1 X j k X Ii 2, i j I j j I i X j, X 2 = W efekcie za optymalny podział uznajemy ten dla którego funkcja osiąga minimum. f(k) = max J 4. Wyniki SE J SA J p Xi 2. Analizę danych doświadczalnych rozpoczęto od metody składowych głównych. Metodę składowych głównych stosowano w celu interpretacji zbioru danych, a nie do ograniczenia liczby zmiennych. W tabeli 1 zestawiono 2

współczynniki korelacji oraz wartości własne dla poszczególnych składowych. Jak można zauważyć do pierwszej składowej wchodzi sześć cech: z których pięć jest skorelowanych ujemnie, a szósta dodatnio. Pozostałe cechy związane są z drugą składową. W trzeciej składowej korelacje można by uznać skorelowanie Borneolu i Tricyklenu, ale te cechy są już związane z pierwszą i drugą składową. Skumulowany procent wyjaśnianej zmienności przez dwie pierwsze składowe wynosi 72% co może być wystarczające dla efektywności wnioskowania (Morrison 1990). Dlatego w dalszej analizie rozważano podział zmiennych w przestrzeni dwóch pierwszych składowych. W wyniku zastosowania metody analizy składowych głównych zaproponowano podział na cztery grupy obiektów. W pierwszej grupie znalazły się obiekty oznaczone jako: SP 2, SP 9 i SP 10, w drugiej: SP 1, SP 3, SP 4, SP 5, SP 8, a w trzeciej i czwartej grupie po jednym obiekcie oznaczonym jako: SP 6 i SP 7 (rysunek 1). Tab. 1. Współczynniki korelacji i udział poszczególnych składowych wyrażony w procentach wariancji ogólnej badanych cech uzyskanych na podstawie macierzy kowariancji. C1 C2 C3 C4 C5 C6 C7 C8 C9 Santen 0.8649 0.0266 0.1355 0.2979 0.1944 0.3004 0.1249 0.0227 0.0056 Tricyklen 0.6344 0.4665 0.5568 0.1048 0.2081 0.0834 0.0694 0.0608 0.0104 α-pinens 0.5079 0.6249 0.2455 0.5035 0.0415 0.0597 0.1744 0.0443 0.0126 Kamfen 0.8761 0.3739 0.0721 0.0994 0.2516 0.1020 0.0575 0.0222 0.0114 β-pinen 0.9286 0.1011 0.0441 0.2558 0.2218 0.0824 0.0053 0.0581 0.0282 β-mircen 0.2767 0.7932 0.4913 0.0056 0.1818 0.0281 0.0772 0.1140 0.0116 β-felandren 0.6633 0.6799 0.2048 0.1202 0.0115 0.1234 0.1305 0.0945 0.0117 Terpinolen 0.6810 0.2082 0.0743 0.5883 0.3136 0.1955 0.0514 0.0450 0.0006 Borneol 0.0662 0.7183 0.6105 0.1254 0.1204 0.2471 0.1248 0.0062 0.0044 Octan bornylu 0.4552 0.7506 0.2667 0.2111 0.2867 0.1314 0.0931 0.0721 0.0172 Wartość własna 4.2302 2.9730 1.1285 0.8493 0.4235 0.2505 0.1040 0.0392 0.0018 Procent zmienności 42.30 29.73 11.28 8.49 4.23 2.51 1.04 0.39 0.02 Skumulowany procent 42.30 72.03 83.32 91.81 96.04 98.55 99.59 99.98 100.00 Następnie na bazie uzyskanych informacji przeprowadzono analizę skupień trzema najczęściej stosowanymi metodami, to znaczy: metodą najdalszego sąsiedztwa, metodą najbliższego sąsiedztwa oraz metodą średniej arytmetycznej (rysunek 2). Jak wiadomo podział w analizie skupień, jest arbitralny i dlatego informacje uzyskane w poprzedniej analizie o liczbie możliwych grup były tu bardzo przydatne. Wykorzystując metodę najbliższego sąsiedztwa uzyskujemy podział na cztery skupienia, czyli taki sam jak w analizie składowych głównych. W pozostałych dwóch zastosowanych metodach sytuacja jest podobna i w zależności, gdzie dokonamy podziału możemy uzyskać taki podział jak zaproponowany w analizie składowych głównych (Tabela 2). Jednak w metodzie najdalszego sąsiedztwa i metodzie średniej arytmetycznej możliwy jest również podział, w którym dwa obiekty SP 6 i SP 7 są w tej samej grupie. Tab. 2. Zestawienie podziałów uzyskanych w analizie skupień w zależności od zastosowanej metody Metoda Obiekty przydzielone do grup metoda najbliższego sąsiedztwa SP 1, SP 3, SP 4, SP 5, SP 8 SP 2, SP 9, SP 10 SP 6 SP 7 metoda najdalszego sąsiedztwa SP 1, SP 3, SP 4, SP 5, SP 8 metoda średniej arytmetycznej SP 2, SP 9, SP 10 SP 6, SP 7 Następnie w celu określenia wpływu cech na podział obiektów zastosowano metodę k-średnich. Rysunek 3 przedstawia funkcję, którą wykorzystano do określenia możliwego podziału na skupienia. Wyniki po zastosowaniu tej metody zupełnie odbiegają od podziałów które uzyskano w poprzednich metodach ponieważ zgodnie z tą metodą powinno się wybrać taki podział w którym funkcja osiąga minimum. Dla naszego przypadku jest to podział na dwa skupienia. W tabeli 3 zestawiono wszystkie możliwe podziały na 3

grupy z zastosowaniem metody k-średnich. Jeżeli dokonano podziału na dwie grupy jednorodne to w pierwszej grupie znalazły się obiekty: SP 1, SP 2, SP 3, SP 4, SP 5, SP 8, SP 9, natomiast w drugiej SP 6, SP 7, SP 10. Stosując taki podział uzyskujemy zupełnie inne pogrupowanie niż w poprzednich metodach. Wybierając jednak podział na cztery skupienia tak jak to było w poprzednich metodach uzyskujemy taki sam przydział obiektów do grup jak w metodzie analizy skupień i metodzie składowych głównych (Tabela 3). Dlatego do analizy wzajemnych powiązań miedzy cechami rozważano podział na cztery skupienia. Na rysunku 4 przedstawiono średnie w czterech skupieniach ze względu na cechy powodujące ich zróżnicowanie. Jak można zauważyć przebieg krzywych na rysunku 4 wykazuje wyraźne różnice pomiędzy cechami. Największe zróżnicowanie jest dla cechy siódmej chociaż ma ono ten sam kierunek to znaczy rośnie dla każdego skupienia. Cechy które różnicują te cztery skupienia to: β-felandren, α-pinen, kamfen, B-pinen i octan bornylu. Tab. 3. Zestawienie podziału na grupy metodą k-średnich Liczba grup 2 3 4 5 6 7 8 9 SP 1 1 1 4 1 1 1 1 1 SP 2 1 3 2 2 2 2 2 2 SP 3 1 1 4 1 1 1 1 1 SP 4 1 1 4 1 5 4 4 4 SP 5 1 1 4 1 5 5 5 5 SP 6 2 2 1 3 6 6 6 6 SP 7 2 2 3 4 3 7 7 7 SP 8 1 1 4 1 1 1 8 8 SP 9 1 3 2 2 2 2 2 9 SP 10 2 3 2 5 4 3 3 3 5. Podsumowanie Wykorzystując trzy metody statystyczne dokonano podziału na cztery grupy obiektów i stwierdzono, występowanie bioróżnorodności w populacji jodły pospolitej. Analiza ta wykazała, że wspólnymi cechami rozróżniającymi skupienia były zawartości związków: β-felandren, β-pinen, kamfen, β-pinen, octan bornym. W tego typu badaniach wskazana jest kompleksowa analiza danych z zastosowaniem wszystkich trzech wielowymiarowych metod statystycznych. W tego typu pracach stosuje się zwykle jedną z trzech przedstawianych metod statystycznych, co może prowadzić do zupełnie różnych wniosków. Wydaje się, że analizę statystyczną należałoby rozpocząć od metody analizy składowych głównych lub analizy k-średnich w celu określenia wstępnego podziału na grupy, a dopiero na bazie tych metod zastosować metodę analizy skupień. Literatura cytowana Falniowski A. (2003). Metody numeryczne w taksonomii. WUJ, Kraków. Krzyśko M. (2000). Wielowymiarowa analiza statystyczna. U AM, Poznań. MacQueen J.B. (1967). Some Methods for Classification and Analysis of Multivariate Observations. Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability, University of California Press, Berkeley, CA, 1, 281-297. Morrison D. F. (1990). Wielowymiarowa analiza statystyczna. PWN, Warszawa. Pawliszyn J. (1997). Solid Phase Microextraction. Theory and Practice. Wiley-VCH, New York. Pietrzykowski R., Rakoczy-Trojanowska M., Zieliński W. (1999). Wykorzystanie grupowania metoda k-średnich w ocenie zmienności somaklonalnej żyta ozimego Secale Cereale L. Colloquium Biometryczne tom 29, 287-292. Pociecha J., Podolec B., Sokołowski A., Zając K. (1988). Metody taksonomiczne w badaniach społeczno-ekonomicznych. PWN, Warszawa. Rezzi S., Bighelli A., Mouillol D., Casanovą J. (2001). Composition and chemical variability of the needle essential oil of Pinus nigra subsp. laricio from Corsica. Flavour Fragr. J; 16:379-383 4

Rys. 1. Podział obiektów przedstawiony w przestrzeni dwóch pierwszych składowych 5

Rys. 2. Dendrogramy uzyskane w wyniku zastosowania analizy skupień: a) metodą najbliższego sąsiedztwa, b) metodą najdalszego sąsiedztwa c) metodą średniej arytmetycznej. 6

Rys. 3. Funkcja określająca liczbę grup w metodzie k-średnich. Rys. 4. Średnie dla podziału na cztery grupy w metodzie k-średnich. 7