Plan prezentacji Chemometria w chromatografii Definicja Historia Wielowymiarowe metody analizy danych - zastosowanie Anna Kaczmarek Katedra Zarządzania Jakością Żywności UP w Poznaniu ak@up.poznan.pl Definicja (1) Chemometria - zastosowanie metod matematycznych i statystycznych w pomiarach chemicznych. (B. Kowalski, Anal. Chem. 52 (1980) 112R) Definicja (2) Wielowymiarowa analiza danych zajmuje się badaniem zbiorów obiektów, opisanych wieloma cechami. Chemometria jest dziedziną nauki i techniki zajmującą się wydobywaniem użytecznej informacji z wielowymiarowych danych pomiarowych, wykorzystującą statystykę i metody numeryczne (J. Mazerski, Podstawy chemometrii, WPG, 2000) 1
Cechy metod chemometrycznych analiza bardzo dużych zbiorów danych pomiarowych wykorzystanie dużej liczby zmiennych do kompleksowego opisu zjawiska dążenie do minimalizacji liczby próbek możliwość uzyskania wysokiej jakości informacji na podstawie danych o dużym poziomie niepewności podejmowanie zagadnień trudnych, leżących na granicy stosowalności metod statystycznych możliwość rozwiązania lub objaśnienia rzeczywistych problemów przy pomocy algorytmów obliczeniowych Historia Pojęcie chemometria wprowadzone zostało przez Svante Wolda i Bruce Kowalski w 1972 r. W roku 1974 założyli Międzynarodowe Towarzystwo Chemometryczne 1974 pierwsza publikacja, w której zastosowano wielowymiarową analizę danych w chemii żywności ( Reiner and Piendl in 1974) 1977 - Chemometrics: Theory and applications - pierwsza książka Schemat obszarów zastosowania technik chemometrycznych Etapy analizy chemometrycznej 1) 2) 3) 4) 5) 6) Postawienie problemu Planowanie pomiarów Wykonanie pomiarów Kontrola danych (wykrywanie błędów grubych, transformacja danych) Wybór odpowiedniej metody Kontrola wiarygodności uzyskanych wyników Źródło: J. Mazerski, Podstawy chemometrii, 2004 2
Macierz danych Analiza chemometrycznachemometryczna- metody Planowanie ekserymentu Metody uczenia bez nadzoru (eksploracja danych) porównywanie obiektów lub zmiennych (PCA, CA, SOM) Matody uczenia z nadzorem - znana wartość parametru,poszukujemy zależności. - kalibracja (jedno- i wielowymiarowa) - analiza dyskryminacyjna i algorytmy klasyfikacji (np. LDA, PLS-DA, SIMCA, ANN) Obszary zastosowania w żywności Traceability of honey origin based on volatiles pattern processing by artificial neural networks Cajka et. al., J. Chromatogr Chromatogr.. 2009 Identyfikacja i kontrola 1) pochodzenie (geograficzne) 2) odmiana 3) pochodzenie zanieczyszczeń 4) fałszowanie, rozcieńczanie 5) pochodzenie składników 6) proces produkcji Cel: Wykorzystanie HS-SPME GC GC TOF-MS do badania związków lotnych miodów Corsica posiadającej certyfikat chronionej nazwy pochodzenia (ChNP) produkowanej na Korsyce. Materiał i metody badań: Badaniami objęto mody z dwóch zbiorów 2006-374 próbek miodu: 111 z Korsyki, 18 z innego rejonu Francji, 15 z Włoch, 18 z Austrii, 2 z Irlandii i 18 z Niemiec. W 2007 108 z Korsyki, 28 z innego rejonu Francji, 15 z Włoch, 23 z Austrii i 18 z Niemiec. Analiza chemometryczna: PCA (Principal Component Analysis) i ANN-MLP(Artificial Neural Network with Multilayer Perceptrons. 3
Markery wybrane do analizy chemometrycznej Markery wybrane do analizy chemometrycznej Schemat sztucznej sieci neuronowej 4
Comparison of the Amounts of Volatile Compounds in French Protected Designation of Origin Virgin Olive Oils Wykres współrzędnych czynnikowych przypadków Berlioz at al., J. Agric. Food Chem Chem..(2006) Cel: Wykorzystanie (HS-SPME) połączonej z (GC-FID) do badania związków lotnych oliwy z oliwek z pierwszego tłoczenia posiadającej certyfikat chronionej nazwy pochodzenia (ChNP) produkowanej na południu Francji (Alpes-Maritimes). Materiał i metody badań: 35 próbek oliwy z oliwek (ChNP) z południa Francji, 6 próbek handlowej oliwy z oliwek oraz 12 próbek oliwy (ChNP) pochodzących z innego rejonu Francji. Analiza chemometryczna: PCA (Principal Component Analysis) i SIMCA (Soft Independent Modelling of Class Analogy). Najważniejsze związki pozwalające rozróżnić poszczególne rodzaje oliwy z oliwek Model klasyfikacji uzyskany za pomocą metody SIMCCA 5
Study of different kinds of Pesto Genovese by the analysis of their volatile fraction and chemometric methods Zunin P., et al., Food Chemistry Chemistry,, (2008) Wykres współrzędnych czynnikowych przypadków (PCA (PCA)) - kategoria 1, - kategoria 2, - kategoria 3 Cel: Wykorzystanie (HSSE) (GC-MS) do badania związków lotnych pesto wytwarzanych trzema sposobami: 1przemysłowo bez pasteryzacji 2- w małych przetwórniach bez pasteryzacji i 3 przemysłowo z pasteryzacją.. Materiał i metody badań: Badaniami objęto próbki pesto kupione w sklepach. Dziewięć z pierwszej kategorii, 13 z drugiej kategorii i 13 z trzeciej kategorii. Analiza chemometryczna: PCA (Principal Component Analysis) STEPLDA (Stepwise Linear Discriminant Analysis). Wykres rozrzutu wartości kanonicznych - kategoria 1 (przemysłowo bez pasteryzacji), pasteryzacji), - kategoria 2 (w (w małych przetwórniach bez pasteryzacji), pasteryzacji), - kategoria 3 (przemysłowo (przemysłowo z pasteryzacją) Tabela wyników wyboru zmiennych dyskryminacyjnych 6
Identification of the Botanical Origin of Raw Spirits Produced from Rye, Potato, and Corn Based on Volatile Compounds Analysis Using a SPMESPME-MS Method Jeleń H., et al.,., J. Agric. Food Chem.( Chem.(2010) Wykres współrzędnych czynnikowych przypadków Cel:Wykorzystanie metody SPME-MS do badania botanicznego pochodzenia spirytusów. Materiał i metody badań: Badaniami objęto 84 próbki spirytusu otrzymanego z żyta, 27 z kukurydzy i 27 z ziemniaków. Analiza chemometryczna: PCA (principal Component Analysis), STEPLDA (Stepwise Linear Discriminant Analysis). Tabela wyników wyboru zmiennych dyskryminacyjnych Wykres rozrzutu wartości kanonicznych 7
Metody chemometryczne-podsumowanie duże zbiory danych (przyczyny: rozwój technik eksperymentalnych, postęp w komputeryzacji, zaawansowane problemy) niepewność, złożony charakter i wielowymiarowość danych informacja: nie jest dostępna bezpośrednio jest zawarta w relacji pomiędzy obiektami lub zmiennymi (znaczny stopień wewnętrznego powiązania) lub przysłonięta przez efekty związane ze specyfiką prowadzonych pomiarów lub pochodzące z otoczenia. dążenie do wydobycia z danych pomiarowych istotnej informacji poszukiwanie zwartej i treściwej reprezentacji danych (numerycznej oraz graficznej) Metody chemometryczne wspierają analizę złożonych danych pomiarowych z zakresu chemii. Oprogramowanie wspierająceobliczenia chemometryczne Matlab Statgraphics MS Excel Mathematica SPSS Statistica Unscrambler 8