WSZCZĘCIE PRZEWODU DOKTORSKIEGO. Proponowany tytuł pracy:

Podobne dokumenty
sygnałów analitycznych y w kontekście kontroli jakości wybranych produktów

Dr hab. Ewa Sikorska, prof. nadzw. UEP Poznań,

OZNACZENIE JAKOŚCIOWE I ILOŚCIOWE w HPLC

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

OZNACZANIE ŻELAZA METODĄ SPEKTROFOTOMETRII UV/VIS

Modelowanie nieselektywnych sygnałów analitycznych w kontekście kontroli jakości wybranych produktów

Cz. 5. Podstawy instrumentalizacji chromatografii. aparatura chromatograficzna w skali analitycznej i modelowej - -- w części przypomnienie -

DOKUMENTACJA SYSTEMU ZARZĄDZANIA LABORATORIUM. Procedura szacowania niepewności

Procedura szacowania niepewności

Walidacja metod analitycznych Raport z walidacji

OFERTA TEMATÓW PROJEKTÓW DYPLOMOWYCH (MAGISTERSKICH) do zrealizowania w Katedrze INŻYNIERII CHEMICZNEJ I PROCESOWEJ

KRYTERIA WYBORU W PLANOWANIU I REALIZACJI ANALIZ CHEMICZNYCH

Chemometria w analityce chemicznej

Zasady wykonania walidacji metody analitycznej

Techniki analityczne. Podział technik analitycznych. Metody spektroskopowe. Spektroskopia elektronowa

Przewaga klasycznego spektrometru Ramana czyli siatkowego, dyspersyjnego nad przystawką ramanowską FT-Raman

ANALIZA ŚLADOWYCH ZANIECZYSZCZEŃ ŚRODOWISKA I ROK OŚ II

Instrukcja do ćwiczeń laboratoryjnych

Materiał obowiązujący do ćwiczeń z analizy instrumentalnej II rok OAM

JAK WYZNACZA SIĘ PARAMETRY WALIDACYJNE

Ana n l a i l za z a i ns n tru r men e t n al a n l a

Monitorowanie stabilności oksydacyjnej oleju rzepakowego na

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

2. Metody, których podstawą są widma atomowe 32

Wysokosprawna chromatografia cieczowa dobór warunków separacji wybranych związków

ANALITYKA PRZEMYSŁOWA I ŚRODOWISKOWA

POTWIERDZANIE TOŻSAMOSCI PRZY ZASTOSOWANIU RÓŻNYCH TECHNIK ANALITYCZNYCH

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Metody Ilościowe w Socjologii

Aproksymacja funkcji a regresja symboliczna

Analiza składowych głównych. Wprowadzenie

Zmienne zależne i niezależne

Kreacja aromatów. Techniki przygotowania próbek. Identyfikacja składników. Wybór składników. Kreacja aromatu

Process Analytical Technology (PAT),

Kurs Chemometrii Poznań 28 listopad 2006

Chemia kryminalistyczna

JAK WYZNACZA SIĘ PARAMETRY WALIDACYJNE

Metody uczenia z nadzorem kalibracja, dyskryminacja i klasyfikacja

JAK UNIKAĆ PODWÓJNEGO LICZENIA SKŁADOWYCH NIEPEWNOŚCI? Robert Gąsior

JAK WYZNACZYĆ PARAMETRY WALIDACYJNE W METODACH INSTRUMENTALNYCH

Wysokosprawna chromatografia cieczowa w analizie jakościowej i ilościowej

Modelowanie glikemii w procesie insulinoterapii

PRODUKTY CHEMICZNE Ćwiczenie nr 3 Oznaczanie zawartości oksygenatów w paliwach metodą FTIR

Analiza korespondencji

W badaniach podjęto się rozwiązania tzw. problemu porównawczego, w którym formułowane są następujące hipotezy:

Ćwiczenie 3++ Spektrometria promieniowania gamma z licznikiem półprzewodnikowym Ge(Li) kalibracja energetyczna i wydajnościowa

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Rozprawa doktorska. mgr Barbara Krakowska. Promotor pracy: dr hab. Michał Daszykowski, prof. UŚ

Parametry krytyczne podczas walidacji procedur analitycznych w absorpcyjnej spektrometrii atomowej. R. Dobrowolski

Techniki immunochemiczne. opierają się na specyficznych oddziaływaniach między antygenami a przeciwciałami

Fizykochemiczne metody w kryminalistyce. Wykład 7

Spektroskopia molekularna. Ćwiczenie nr 1. Widma absorpcyjne błękitu tymolowego

Firma szkoleniowa 2014 roku. TOP 3 w rankingu firm szkoleniowych zaprasza na szkolenie:

10 czerwca 2016r., Warszawa

CHEMOMETRYCZNE PODEJŚCIE W POSZUKIWANIU MARKERÓW AUTENTYCZNOŚCI POLSKICH ODMIAN MIODÓW

Etapy modelowania ekonometrycznego

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

METODY STATYSTYCZNE W BIOLOGII

Moduły kształcenia. Efekty kształcenia dla programu kształcenia (kierunku) MK_06 Krystalochemia. MK_01 Chemia fizyczna i jądrowa

Nowoczesne metody analizy pierwiastków

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Analiza i monitoring środowiska

Rozwiązania firmy Harrer & Kassen do pomiaru gęstości i wilgotności

Źródła błędów i ich eliminacja w technice ICP.

SPEKTROMETRIA IRMS. (Isotope Ratio Mass Spectrometry) Pomiar stosunków izotopowych (R) pierwiastków lekkich (H, C, O, N, S)

Automatyczne sterowanie gotowaniem cukrzycy z zastosowaniem pomiaru masy kryształów metodą spektrometrii w bliskiej podczerwieni

METODY STATYSTYCZNE W BIOLOGII

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

SPEKTROMETRIA CIEKŁOSCYNTYLACYJNA

SKUTECZNOŚĆ IZOLACJI JAK ZMIERZYĆ ILOŚĆ KWASÓW NUKLEINOWYCH PO IZOLACJI? JAK ZMIERZYĆ ILOŚĆ KWASÓW NUKLEINOWYCH PO IZOLACJI?

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

Efekty kształcenia dla kierunku studiów CHEMIA studia pierwszego stopnia profil ogólnoakademicki

Programowanie celowe #1

Wprowadzenie do statystyki dla. chemików testowanie hipotez

Właściwości przeciwutleniające etanolowych ekstraktów z owoców sezonowych

TECHNIKA SPEKTROMETRII MAS ROZCIEŃCZENIA IZOTOPOWEGO (IDMS)-

IR II. 12. Oznaczanie chloroformu w tetrachloroetylenie metodą spektrofotometrii w podczerwieni

STATYSTYKA EKONOMICZNA

PDF created with FinePrint pdffactory Pro trial version

Analiza środowiskowa, żywności i leków CHC l

WALIDACJA - ABECADŁO. OGÓLNE ZASADY WALIDACJI

Wprowadzenie do analizy korelacji i regresji

6 C2A_W02_03 Ma wiedzę z zakresu logistyki produktów przerobu ropy naftowej i produktów polimerowych.

Jan Drzymała ANALIZA INSTRUMENTALNA SPEKTROSKOPIA W ŚWIETLE WIDZIALNYM I PODCZERWONYM

Badania biegłości laboratorium poprzez porównania międzylaboratoryjne

Wyznaczanie minimalnej odważki jako element kwalifikacji operacyjnej procesu walidacji dla wagi analitycznej.

Transformacja wiedzy w budowie i eksploatacji maszyn

ZASTOSOWANIE PROGRAMOWANIA LINIOWEGO W ZAGADNIENIACH WSPOMAGANIA PROCESU PODEJMOWANIA DECYZJI

Opracowanie metodyk METODYKA OZNACZANIA KWASU ASKORBINOWEGO,

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

MINIMALNY ZAKRES PROGRAMU STAŻU

Ćwiczenie 1. Zagadnienia: spektroskopia absorpcyjna, prawa absorpcji, budowa i działanie. Wstęp. Część teoretyczna.

Analiza instrumentalna

Obowiązek znakowania i barwienia paliw a wynikające stąd problemy

Ćwiczenie 3 Pomiar równowagi keto-enolowej metodą spektroskopii IR i NMR

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

PROGRAMU STAŻU. realizowanego w ramach Projektu pt.: CheS Chemik na Staż (Program Operacyjny Wiedza Edukacja Rozwój, Priorytet III, Działanie 3.

JAK ZMIERZYĆ ILOŚĆ KWASÓW NUKLEINOWYCH PO IZOLACJI? JAK ZMIERZYĆ ILOŚĆ KWASÓW NUKLEINOWYCH PO IZOLACJI?

Transkrypt:

WSZCZĘCIE PRZEWODU DOKTORSKIEGO Proponowany tytuł pracy: Modelowanie nieselektywnych sygnałów analitycznych w kontekście kontroli jakości wybranych produktów Joanna Orzeł Opiekun pracy: dr hab. Michał Daszykowski, prof. UŚ Instytut Chemii Wydział Matematyki, Fizyki i Chemii Uniwersytet Śląski Katowice, 2013

Spis treści 1. Wstęp... 2. Nieselektywne sygnały analityczne... 3. Przygotowanie nieselektywnych sygnałów do analizy... 4. Wykorzystanie użytecznej informacji znajdującej się w nieselektywnych sygnałach analitycznych... 4.1 Eksploracja struktury danych... 4.2 Klasyfikacja/dyskryminacja próbek... 4.3 Kalibracja wybranej własności... 4.4 Przykłady zastosowań nieselektywnych sygnałów i chemometrii w kontekście monitorowania jakości... 5. Cel Pracy... 6. Badania własne... 6.1 Kontrola jakości cukru na podstawie fluorescencyjnych odcisków palca i stabilnej kalibracji... 6.2 Ocena jakości oleju napędowego pod względem zawartości dodatków akcyzowych... 6.3 Ocena całkowitej zdolności antyoksydacyjnej herbaty rooibos na podstawie danych chromatograficznych... 7. Podsumowanie... 8. Dalsze plany naukowe... 9. Literatura... 10. Dorobek naukowy... 3 4 6 12 12 12 12 14 15 16 16 16 21 26 27 28 31 2

1. Wstęp Jednym z aktualnych wyzwań analizy chemicznej jest ocena właściwości próbek o złożonym składzie chemicznym. Jest to zagadnienie istotne zarówno ze względu na oznaczenia jakościowe i ilościowe poszczególnych składników chemicznych, jak i w kontekście oceny właściwości będących efektem interakcji komponentów próbki. Właściwości zależące od globalnego składu chemicznego to np. smak, zapach, całkowita zdolność antyoksydacyjna, konsystencja czy wartość energetyczna. Niektóre z tych parametrów składają się natomiast na jakość produktów. Ocena jakości, zależącej od wielu parametrów (w tym globalnego składu chemicznego) z definicji wymaga podejścia globalnego i nie można oczekiwać, że będzie to możliwe poprzez monitorowanie jednego czy dwóch parametrów. Dlatego próbkę opisuje się przez sygnał analityczny (potencjalnie bogaty w informację chemiczną). Taki sygnał będzie złożony, gdyż zawiera wkłady pochodzące od indywidualnych komponentów próbki. Jedynie techniki rozdziału (np. spektrometria mas czy chromatografia) mają potencjał izolowania poszczególnych komponentów próbki, przez co uzyskany sygnał analityczny może być selektywny. Jednakże możliwość rejestracji selektywnych sygnałów w dużym stopniu zależy od parametrów pomiaru (np. rozdział chromatograficzny musi być optymalny to wymaga odpowiedniego doboru kolumny, fazy ruchomej, warunków rozdziału, itp.) oraz liczby składników próbki. Trudno oczekiwać w pełni udanego rozdziału próbek naturalnych benzyna, ropa naftowa, próbki biologiczne, produkty spożywcze. Poprawy jakości sygnału analitycznego (jakości uzyskanego rozdziału) można dokonać między innymi: stosując procedury laboratoryjne (np. wstępne oczyszczanie próbki, ekstrakcja czy zagęszczanie), zwiększając zdolność rozdzielczą (np. stosowanie ortogonalnych systemów chromatograficznych, dodatkowego rozdziału, technik sprzężonych czy zaawansowanej detekcji), wykorzystując techniki chemometryczne w celu izolacji użytecznej informacji, która nie jest bezpośrednio dostępna z powodu interferencji sygnałów wszystkich komponentów mieszaniny. Dostępność narzędzi chemometrycznych ułatwiających interpretację, eksplorację, klasyfikację i kalibrację złożonych sygnałów analitycznych jest powodem coraz częstszego używania nieselektywnych sygnałów analitycznych do oceny wybranych parametrów (w tym jakości) produktów. Sygnały nieselektywne opisują jednocześnie wiele składników chemicznych próbki, pośród których znajdują się te, wpływające na monitorowany parametr. Zasób informacji w nich zawartej pozwala rozpatrywać je jako tzw. chemiczne odciski palca badanych próbek oddające ich unikalność. Zastosowanie poprawnie dobranych metod chemometrycznych umożliwia modelowanie właściwości, które są objaśniane przez różne fragmenty sygnału analitycznego. Wykorzystanie rozwiązań chemometrycznych do analizy sygnałów nieselektywnych cieszy się coraz większym zainteresowaniem, zwłaszcza w kontekście badań próbek spożywczych, analityki procesowej czy monitoringu środowiska. 3

2. Nieselektywne sygnały analityczne Termin nieselektywny sygnał analityczny może odnosić się do każdego sygnału instrumentalnego (np. chromatogramu lub różnego rodzaju widm spektroskopowych), który zawiera informacje o chemicznych komponentach próbki i równocześnie nie pozwala na jednoznaczne oznaczenie jakościowe bądź ilościowe wybranego składnika lub też określonej właściwości analizowanej mieszaniny chemicznej. Typowe sygnały nieselektywne są rejestrowane dla próbek naturalnych przy użyciu takich technik jak spektroskopia bliskiej podczerwieni, spektroskopia 1 HNMR czy chromatografia. Oczywiście sygnał nieselektywny generowany dla tej samej substancji przez różne techniki instrumentalne, będzie się znacznie różnił. Jako dwie skrajności można porównać chromatogram, na którym pojedyncza substancja będzie reprezentowana przez jeden pik chromatograficzny oraz widmo 1 HNMR, na którym ta sama substancja będzie reprezentowana przez zbiór pików zależny od jej struktury chemicznej (rys. 1). Rys. 1 Przykładowy chromatogram na którym jeden z pików odpowiada propionianowi 2-fenyloetylu oraz zbiór pików tworzących widmo 1 HNMR reprezentujące ten sam związek chemiczny [1]. Chromatogramy Rozdział chromatograficzny to jedna z operacji analitycznych, najczęściej wykonywana w celu identyfikacji składu chemicznego złożonych próbek. Dzięki zastosowaniu zróżnicowanych układów chromatograficznych możliwy jest skuteczny rozdział komponentów chemicznych zawartych w badanej próbce. Użycie różnych typów detektorów (np. detektora z matrycą diodową, z ang. diode array detector DAD, lub spektrometrii mas, ang. mass spectrometry detector MS) do oznaczenia chromatograficznie rozdzielonych komponentów próbki umożliwia uzyskanie pełniejszej informacji o jej składzie chemicznym. Jednakże identyfikacja poszczególnych substancji rozdzielonych i wykrytych podczas procedury chromatograficznej jest zadaniem często skomplikowanym i wymaga użycia kosztownych wzorców. W przypadku próbek o złożonym składzie chemicznym, skuteczny 4

rozdział komponentów oraz identyfikacja poszczególnych substancji chemicznych bywają trudne lub nawet niemożliwe do osiągnięcia. Nie mniej jednak chromatograficzne odciski palca próbek w połączeniu z narzędziami chemometrycznymi umożliwiają konstrukcję modeli użytecznych w kontekście kontroli jakości, nawet gdy poszczególne piki nie zostały zidentyfikowane i/lub nie został uzyskany optymalny rozdział chromatograficzny. Widma spektroskopowe Podczas rejestracji widma absorpcyjnego lub emisyjnego analizuje się oddziaływanie próbki z promieniowaniem elektromagnetycznym. W zależności od wybranej metodyki pomiaru badana jest: interakcja składników próbki z promieniowaniem elektromagnetycznym o danej energii (jedna wybrana długość fali elektromagnetycznej) w wybranym zakresie pomiarowym, np. widmo absorpcyjne UV-Vis, widmo w zakresie bliskiej podczerwieni (NIR), widmo fluorescencyjne; interakcja składników próbki z promieniowaniem elektromagnetycznym o różnej energii w wybranym zakresie spektralnym, np. fluorescencyjne obrazy próbek. Bez względu na wybraną metodykę pomiaru, rejestrowane widma mogą być nieselektywne. Te, które są rejestrowane dla szerokiego zakresu pomiarowego z reguły niosą najwięcej chemicznie istotnej informacji, a zatem sygnał jest bardziej charakterystyczny. Przykładem tego typu nieselektywnych, ale informatywnych sygnałów spektroskopowych są fluorescencyjne obrazy. Fluorescencyjne obrazy Fluorescencyjne widma synchroniczne, nazywane również fluorescencyjnymi obrazami (z ang. excitation-emission fluorescence spectroscopy lub fluorescence landscapes), to typ pomiarów instrumentalnych, wynikiem których są dwuwymiarowe sygnały analityczne. W trakcie pomiarów próbka jest wzbudzana promieniowaniem elektromagnetycznym o różnej długości (w zakresie UV-VIS). Równocześnie dla każdej fali wzbudzającej rejestrowane jest widmo emisyjne (w zakresie UV-VIS). Tak powstaje sygnał analityczny, niosący informację zarówno o właściwościach absorpcyjnych jak i emisyjnych komponentów zawartych w badanej substancji. Przykłady fluorescencyjnych obrazów różnych układów chemicznych zostały przedstawione na rys. 2. 5

Emisja [nm] Emisja [nm] Emisja [nm] Emisja [nm] 250 Fenyloalanina 900 800 300 700 600 350 500 400 300 400 200 100 0 450 250 270 290 Wzbudzenie [nm] Tyrozyna 250 900 800 Tryptofan + tyrozyna + fenyloalanina 250 300 450 400 350 300 700 300 350 600 500 350 250 400 200 400 300 200 100 400 150 100 450 0 250 270 290 Wzbudzenie [nm] Tryptofan 250 700 50 450 0 250 270 290 Wzbudzenie [nm] 300 600 500 350 400 300 400 200 100 450 0 250 270 290 Wzbudzenie [nm] Rys. 2 Fluorescencyjne obrazy aminokwasów: fenyloalaniny, tyrozyny i tryptofanu oraz ich równo molowej mieszaniny [2]. Fluorescencyjne obrazy (fluorescencyjne odciski palca), podobnie jak klasyczne pomiary fluorescencyjne, są czułe i nie powodują zniszczenia badanego materiału. Kolejną zaletą tego typu pomiarów jest to, że w porównaniu z pojedynczymi widmami fluorescencyjnymi są bardziej informatywne. Większość z generowanych przez aktualnie dostępne techniki spektroskopowe sygnałów jest nieselektywna. Nieselektywne sygnały rejestrowane podczas pomiarów wykonywanych przy użyciu spektroskopii: fluorescencyjnej, bliskiej podczerwieni (NIR), podczerwieni (IR) czy mas (MS), a także chromatogramy, stanowią chemiczne odciski palca próbek oraz coraz częściej znajdują zastosowanie w szeroko pojętej kontroli jakości. 3. Przygotowanie nieselektywnych sygnałów do analizy Wady sygnałów nieselektywnych Każdy sygnał instrumentalny składa się z trzech komponentów: szumu, linii bazowej oraz informacji o komponentach próbki [3] (zob. rys. 3). 6

Intensywnosc Czysty sygnal analityczny Linia bazowa Szum 60 50 40 30 20 10 Sygnal instrumentalny 0 50 100 150 200 250 300 Punkty pomiarowe 0 0 50 100 150 200 250 300 Punkty pomiarowe Rys. 3 Elementy składowe sygnału instrumentalnego na przykładzie chromatogramu dla dwuskładnikowej mieszaniny. Szum i linia bazowa to komponenty sygnału mogące istotnie zniekształcać piki poszczególnych składników próbki. W takim przypadku analiza jakościowa jak i ilościowa jest utrudniona, a czasem wręcz niemożliwa do przeprowadzenia. Dlatego ważna jest znajomość źródeł tych efektów oraz często konieczne jest ich usunięcie przed dalszą analizą. Komponent sygnału analitycznego o najwyższej częstotliwości szum to efekt zmienności sygnału wynikającej z ograniczonej czułości używanego detektora oraz różnych zjawisk i oddziaływań zachodzących w trakcie dokonywania pomiaru. Definiowany jest jako odchylenie standardowe od wartości średniej sygnału rejestrowanego przez przyrząd pomiarowy [4]. Poziom szumu surowego widma określa parametr nazywany stosunkiem sygnału do szumu (S/N - wyrażany jako stosunek średniej z sygnału do jego odchylenia standardowego). Wyróżnia się kilka rodzajów szumu, między innymi szum biały, proporcjonalny do sygnału czy skorelowany. Bez względu na rodzaj szumu należy zawsze sprawdzić wartość parametru S/N i ocenić czy usunięcie tego efektu z surowego sygnału jest konieczne (ze względu na to, że nie jest chemicznie istotnym komponentem, może negatywnie wpłynąć na interpretację wyników). Operacji tej można dokonać np. używając filtra skonstruowanego z użyciem mediany albo średniej ważonej lub w przypadku zbioru sygnałów, przeprowadzić kompresję danych przy użyciu metody analizy czynników głównych (ang. principal komponent analysis, PCA) [5]. Kolejnym składnikiem sygnałów charakteryzującym się najmniejszą częstotliwością, jest linia bazowa. Jest to odpowiedź detektora rejestrowana podczas nieobecności analitów w próbce. Może ona ulegać zmianom w czasie, dlatego pomimo że występuje w każdym sygnale jej kształt może być różny. Podobnie jak w przypadku szumu, przed dokonaniem analizy chemometrycznej powinna być usunięta. Najczęściej stosowane sposoby eliminacji linii bazowej zakładają wykorzystanie nieliniowych filtrów, czy metody asymetrycznych najmniejszych kwadratów z funkcją kary (ang. penalized asymmetric least-squares, P-ALS) [6]. Innym problemem spotykanym zwłaszcza podczas identyfikacji poszczególnych komponentów próbek o złożonym składzie chemicznym, jest nakładanie się pików różnych substancji. Jest to efektem np. zbliżonych właściwości spektralnych lub powinowactwa do fazy chromatograficznej poszczególnych substancji chemicznych. Nakładanie się pików 7

zostaje niwelowane przez dekonwolucję sygnału czyli operację matematyczną, której wynikiem jest przedstawienie sygnałów jako sumy wkładów poszczególnych składników reprezentowanych przez nakładające się piki. Dekonwolucji można dokonać np. estymując funkcje matematyczne (np. funkcja Gaussa). Zastosowanie zaawansowanych narzędzi chemometrycznych, jak metoda MCR-ALS (ang. multivariate curve resolution alternating least squares) [7], PARAFAC (ang. parallel factor analysis) [8] lub transformacja sygnału w domenę częstotliwości [3], umożliwia estymację widm czystych składników. Transformacja Fouriera czy falkowa [9] umożliwia również usunięcie linii bazowej oraz szumu. Innym sposobem wydobycia pożądanych informacji z nałożonych pików jest obliczenie pierwszej lub wyższej pochodnej analizowanego sygnału. Sygnały instrumentalne rejestrowane są dla określonej liczby punktów pomiarowych (określanej np. przez krok pomiarowy w trakcie rejestracji widma UV-VIS). Ponieważ pik danej substancji jest reprezentowany przez kilka (lub więcej) punktów pomiarowych, sygnały zawierają skorelowane zmienne. Uniemożliwia to wykorzystanie metody regresji wielorakiej (ang. multilinear regression, MLR) [10], ze względu na jej matematyczne ograniczenia. Wykorzystuje się wówczas zmienne niezależne wybrane z całego sygnału lub skonstruowane na jego podstawie. Omówione komponenty i towarzyszące im problemy są typowe dla wszystkich sygnałów instrumentalnych. Negatywny wpływ na rezultaty analizy porównawczej i modelowania sygnałów mogą mieć również efekty charakterystyczne dla danej metody. Dlatego, przygotowanie danych do analizy powinno obejmować również ocenę ich wpływu i ewentualne usunięcie z analizowanego sygnału. Fluorescencyjne obrazy W trakcie rejestracji fluorescencyjnych obrazów wiązka promieniowania wzbudzającego w wyniku kontaktu z próbką ulega różnym zjawiskom fizycznym. Może zostać zaabsorbowana przez komponenty próbki (następstwem tego zjawiska jest między innymi emisja promieniowania fluorescencyjnego, rozchodzącego się w każdym kierunku przestrzeni), przejść przez nią bez zmiany energii lub ulec rozproszeniu na cząsteczkach w niej zawartych. Promieniowanie przechodzące przez próbkę w trakcie wykonywania pomiaru fluorescencyjnego dzięki stosowanej geometrii układu pomiarowego nie dociera do detektora (najczęściej źródło wzbudzenia i detektor ustawione są względem siebie pod kątem prostym). Natomiast promieniowanie rozproszone rozchodzi się w każdym kierunku przestrzeni (podobnie jak promieniowanie emisyjne), docierając również do detektora. W zależności od tego czy zjawisko rozproszenia ma charakter sprężysty czy też nie na fluorescencyjnych obrazach obserwuje się je jako charakterystyczne diagonalne linie rozproszenia Rayleigha (sprężyste) lub Ramana (niesprężyste) [11] (zob. rys. 4). Te składowe obrazu fluorescencyjnego są chemicznie nieistotne i mogą interferować z sygnałami badanych składników, dlatego powinny zostać usunięte. 8

Rozproszenie Rayleigha Rozproszenie Ramana 5 0 500-5 700 450 400 600 350 500 300 400 Wzbudzenie [nm] Emisja [nm] Rys. 4 Linie rozproszenia promieniowania elektromagnetycznego sprężystego (Rayleigha) i niesprężystego (Ramana), obserwowane na fluorescencyjnym obrazie. 1000 1000 800 800 600 Intensywnosc Intensywnosc Eliminacji pików rozproszenia można dokonać na kilka sposobów. Na przykład obszary widma zastępuje się brakującymi elementami lub zerami [12,13]. Takie postępowanie może być przyczyną utraty informacji zawartej w naruszonym sygnale (jest to szczególnie istotne w przypadku, gdy piki rozproszenia nakładają się z pikami komponentów próbki). Dlatego eliminacja tego efektu powinna być połączona z interpolacją naruszonego widma, np. wykorzystując triangulację Delaunaya [14] (zob. rys. 5). 400 600 400 200 200 0-200 580 530 660 480 430 560 460 Emisja [nm] 0 580 530 660 480 430 560 380 460 Wzbudzenie [nm] Emisja [nm] 380 Wzbudzenie [nm] Rys. 5 Fluorescencyjny obraz próbki piwa przed (widmo lewe) i po (widmo prawe) usunięciu pików rozproszenia promieniowania elektromagnetycznego. W przypadku pomiarów próbek o złożonym składzie lub dużych stężeniach analitów intensywność promieniowania fluorescencyjnego może być zmniejszona w wyniku zjawisk zachodzących w badanej próbce. Efekt taki nazywa się wygaszeniem fluorescencji i jest powodowany np. przez zderzenia wzbudzonych fluoroforów z molekułami zdolnymi do absorpcji ich energii czy też tworzenie kompleksów nie zdolnych do fluorescencji (np. z interferentami zawartymi w matrycy). Zjawisko wygaszenia fluorescencji jest 9

niekorzystne dla ilościowego oznaczenia badanych składników chemicznych. W celu jego eliminacji stosuje się odpowiednie rozcieńczenie analizowanej substancji lub wstępny rozdział analitów od matrycy [11]. Chromatogramy Chromatogramy rejestrowane dla tej samej próbki (lub zbioru próbek) mogą mieć różną liczbę punktów pomiarowych (różną długość). Uniemożliwia to zestawienie sygnałów w macierz (niezbędne do przeprowadzenia analizy chemometrycznej). Dlatego chromatogramy o różnej liczbie punktów pomiarowych należy ujednolicić tak, aby każdy miał tę samą długość. Podczas rozdziału chromatograficznego efekt starzenia złoża kolumny chromatograficznej i niestabilność warunków rozdziału (np. wahania składu fazy ruchomej) powodują przesunięcia pików reprezentujących tę samą substancję na różnych chromatogramach. Analiza porównawcza sygnałów wymaga ich wstępnego nałożenia, tj. umiejscowienia odpowiadających sobie pików w tych samych pozycjach na osi czasu elucji. Jest to możliwe dzięki użyciu chemometrycznych metod nakładania pików chromatograficznych. Jedną z nich jest metoda zoptymalizowanego nakładania widm maksymalizująca ich wzajemną korelację (ang. correlation optimized warping, COW) [15]. Zestawienie sygnałów analitycznych Niezbędnym etapem przygotowania danych do chemometrycznej analizy jest ich odpowiednie zestawienie. W przypadku sygnałów instrumentalnych, które dla każdej próbki mają postać wektora (np. chromatogramy, widma NIR, 1 HNMR), organizuje się je w macierz. Kolejne wiersze macierzy to sygnały reprezentujące badane próbki (zob. rys 6). Tak przygotowany zbiór sygnałów można analizować wykorzystując klasyczne metody chemometryczne, np. analizę czynników głównych - PCA [5] czy regresję częściowych najmniejszych kwadratów (ang. partial least squares, PLS) [10]. Rys.6 Schemat zestawiania przykładowych sygnałów instrumentalnych w macierz. 10

Dwuwymiarowy charakter fluorescencyjnych obrazów daje różne możliwości ich organizacji. Sygnały można rozwinąć (utworzyć sygnały jednowymiarowe) zob. rys. 7, a następnie, podobnie jak w przypadku np. chromatogramów, wykorzystać klasyczne chemometryczne metody wizualizacji i modelowania danych. Rys. 7 Proces rozwijania fluorescencyjnego obrazu; Wz oznacza długość fali wzbudzającej dla której zarejestrowano widmo emisyjne. Widma można także zestawić w trójwymiarową strukturę, której kolejne wymiary odpowiadają długościom fal wzbudzenia, emisji oraz próbkom (zob. rys. 8). Tak zestawione sygnały modeluje się, wykorzystując metody dedykowane danym n-modalnym, np. PARAFAC [8] czy n-modalną regresję częściowych najmniejszych kwadratów (ang. n-way partial least squares, n-pls) [16]. Rys. 8 Konstrukcja trójwymiarowej struktury danych fluorescencyjnych 11

4. Wykorzystanie użytecznej informacji znajdującej się w nieselektywnych sygnałach analitycznych Odpowiednio przygotowane nieselektywne sygnały analityczne są analizowane wykorzystując metody chemometryczne. 4.1. Eksploracja struktury danych Pierwszym etapem interpretacji danych jest eksploracja ich struktury. Ma ona na celu ułatwić wizualizację informacji zawartej w analizowanych sygnałach, co w przypadku wieloparametrowych danych skorelowanych, jakimi są sygnały nieselektywne, wymaga redukcji ich kompleksowości. Eksploracja danych ułatwia ocenę podobieństw próbek i ustalenie kompleksowości badanego układu (zjawiska), a także często determinuje dalszą interpretację uzyskanych wyników. Najczęściej wykorzystywanym narzędziem eksploracyjnym jest analiza czynników głównych, PCA [5]. Innym sposobem za pomocą, którego można tego dokonać jest konstrukcja modeli PARAFAC [8], dedykowanych do analizy danych n-modalnych. W zależności od założonych celów badawczych, kolejne etapy interpretacji nieselektywnych sygnałów mogą obejmować konstrukcję modeli klasyfikacyjnych, dyskryminacyjnych lub kalibracyjnych. 4.2. Klasyfikacja/dyskryminacja próbek Klasyfikacyja/dyskryminacyja ma na celu ustalenie przynależności próbki do jednej (lub kilku) ze ściśle zdefiniowanych klas, na podstawie utworzonych reguł logicznych. Używając sygnałów nieselektywnych odpowiednie modele konstruuje sią wykorzystując takie chemometryczne techniki jak liniowa analiza dyskryminacyjna (ang. linear discriminant analysis, LDA) [17], dyskryminacyjna metoda częściowych najmniejszych kwadratów (ang. discriminant partial least squares, D-PLS) [18] czy drzewa klasyfikacji i regresji (ang. classification and regression trees, CART) [19]. 4.3. Kalibracja wybranej własności Modele kalibracyjne tworzy się by opisać zależność pomiędzy informacją o fizycznych właściwościach próbki np. widmem, a ilościową zawartością badanego składnika (składników) lub modelowanej właściwości (np. całkowitej zdolności antyoksydacyjnej). Chemometryczne metody kalibracyjne to np. regresja głównych składowych (ang. principal component regression, PCR) [20] czy regresja częściowych najmniejszych kwadratów - PLS) [20]. Znane są również metody dedykowane dla danych zestawionych w trójwymiarową strukturę, np. n-modalna regresja częściowych najmniejszych kwadratów, 12

n-pls [16]. W przypadku fluorescencyjnych obrazów metody n-modalne wykorzystują trójliniową strukturę danych (ang. trilinear data), warunkowaną przez ich drugorzędowość (zob. rys. 9). Rys. 9 Rzędowość danych fluorescencyjnych. Dane o trój-liniowej strukturze posiadają następujące cechy: liniowa zależność sygnału analitu od jego stężenia; dwuliniowość sygnału (ang. bilinearity) dla każdej próbki (tzn. sygnał może być przedstawiony jako iloczyn dwóch wektorów, które pomnożone przez siebie odtworzą ten sygnał); stałość profili analitów dla różnych próbek (tzn. kształt profilu dla pojedynczego komponentu jest identyczny we wszystkich rejestrowanych sygnałach z ewentualną zmianą intensywności, związaną ze zmianą stężenia tego analitu) [21]. Często obserwuje się, że modele chemometryczne konstruowane na podstawie fluorescencyjnych obrazów są nieczułe na obecność ewentualnych interferentów obecnych w badanych próbkach. Taka cecha nazywana jest zaletą drugorzędowości (ang. second order advantage). Jednak nie każdy model skonstruowany na podstawie fluorescencyjnych obrazów będzie ją posiadał. Modelowanie rozwiniętych widm metodą PLS często prowadzi do modeli kalibracyjnych o bardzo dobrych właściwościach predykcyjnych, niestety zaburzenie trój-liniowej struktury danych (przez ich rozwinięcie) powoduje utratę zalety drugorzędowości. Metody PARAFAC i n-pls wykorzystują dekompozycję trój-liniowej struktury danych i dzięki temu zaleta drugorzędowości zostaje zachowana. 13

4.4. Przykłady zastosowań nieselektywnych sygnałów i chemometrii w kontekście monitorowania jakości Ze względu na liczne zalety nieselektywnych sygnałów analitycznych i chemometrii, są one często stosowane w rozwiązaniach różnych problemów analitycznych. Intensywnie wykorzystuje się je do kontroli jakości żywności. Między innymi do weryfikacji pochodzenia geograficznego np. olejów, oliw, gatunków ziół, miodu czy wina [22, 23, 24]. Bada się również przemiany chemiczne zachodzące w żywności na przestrzeni czasu (ang. shelf life) [25, 26, 27] oraz w trakcie procesów produkcyjnych (tzw. analiza typu on-line), np. do kontroli fermentacji alkoholowej [28] czy postępu procesu oksydacji oliwy z oliwek [29]. Kolejną dziedziną w której nieselektywne sygnały znalazły swoje zastosowanie są badania środowiskowe. Ze względu na dużą czułość techniki, fluorescencyjne obrazy często są używane do oznaczania śladowych i ultra-śladowych zawartości zwłaszcza związków organicznych w wodzie [30, 31], glebach [32] czy osadach [33]. Zastosowanie sygnałów nieselektywnych i chemometrii w badaniach farmakologicznych do analiz leków zawierających pojedyncze substancje aktywne [34, 35] jak i tych wieloskładnikowych, charakteryzujących się matrycą o skomplikowanym składzie [36] jest nieocenione. Prowadzone są również badania płynów biologicznych takich jak mocz, krew, czy plazma w kontekście diagnostyki chorób, poszukiwań potencjalnych biomarkerów schorzeń [37, 38] lub kontroli dynamiki procesu uwalniana i dystrybucji leków w ludzkim organizmie [39]. Oddzielnym zagadnieniem jest użycie nieselektywnych sygnałów i chemometrii w badaniach metabolomicznych czy proteomicznych [40]. Te stosunkowo młode dziedziny nauki stają się coraz popularniejsze, głównie ze względu na badania medyczne i biotechnologiczne. Dzieje się tak dzięki możliwości chemometrycznej ekstrakcji informacji zawartej w dwuwymiarowych żelach elektroforetycznych [41] czy widmach masowych pochodzących z pomiarów typu MS/MS [42], które są często wykorzystywane w badaniach metabolo- i proteomicznych. Kolejną ważną dziedziną w której omawiane sygnały znalazły swoje szerokie zastosowanie jest analiza jakości produktów energetycznych. W literaturze opisane są metody dedykowane analizie paliw, biopaliw jak i syntetycznych mieszanek węglowodorów [43, 44]. Duża liczba publikacji poświęconych użyciu nieselektywnych sygnałów i chemometrii w kontekście monitoringu jakości, świadczy o potrzebie tego typu rozwiązań. Najczęściej do opracowywania nowych metodyk analityki procesowej (dział nauki opisujący zagadnienia związane z monitoringiem procesów produkcyjnych) wykorzystywane są sygnały instrumentalne generowane przez techniki niedestrukcyjne, które można zastosować w analizach typu on-line (np. spektroskopia fluorescencyjna, NIR). Ze względu na stały wzrost wymagań stawianych różnorodnym produktom, jak również na konieczności dokonywania analiz jakości w odniesieniu do badań z różnorodnych dziedzin np. środowiskowych, biologicznych czy kryminalistycznych, podejście chemometryczne do analizy sygnałów nieselektywnych jest zagadnieniem niezwykle istotnym. 14

5. Cel pracy Celem mojej pracy jest efektywne wykorzystanie informacji zawartej w nieselektywnych sygnałach analitycznych w połączeniu z narzędziami chemometrycznymi do rozwiązywania problemów szeroko pojętej chemii analitycznej. Wśród nich są takie problemy jak: kontrola jakości wybranych produktów spożywczych (np. zabawienia cukru czy ilości przeciwutleniaczy w jedzeniu) oraz badanie autentyczności produktów (np. ocena zawartości dodatków akcyzowych w oleju napędowym). Ze względu na właściwości spektroskopii fluorescencyjnej i liczne zalety charakteryzujące fluorescencyjne obrazy (w porównaniu z widmem emisyjnym rejestrowanym dla pojedynczej fali wzbudzenia) są to nieselektywne sygnały analityczne, na których skupiam największą uwagę w mojej pracy badawczej. Nie mniej jednak zastosowanie innych nieselektywnych sygnałów (np. chromatogramów) w kontekście monitoringu jakości jest również obiektem moich badań. 15

6. Badania własne 6.1. Kontrola jakości cukru na podstawie fluorescencyjnych odcisków palca i stabilnej kalibracji W zależności od rodzaju produktu, którego jakość jest oceniana (np. spożywczy, petrochemiczny, kosmetyczny, farmaceutyczny itd.), składające się na nią czynniki są różne. Bez względu na rodzaj produktu konsumenci zwracają uwagę na to, aby jego jakość była jak najlepsza, gdyż często świadczy ona o względnym bezpieczeństwie i/lub dobrych właściwościach sensorycznych kupowanego produktu. Jakość produktu to często pojęcie subiektywne, ponieważ oceniana jest przez konsumentów przy użyciu ich zmysłów. Czynniki wpływające na decyzję konsumenta to między innymi wygląd, zapach czy tekstura towaru. Są one zależne od procesu technologicznego służącego do otrzymania produktu i jakości surowca, które są poddawane wszystkim etapom procesu. Celem producentów jest dbałość o wysoką jakość końcowego produktu i surowca wykorzystywanego do jego otrzymania. Dokonuje się tego badając ich właściwości chemiczne i fizyczne przed i bezpośrednio w trakcie procesu produkcyjnego. W celu usprawnienia wykonywanych analiz coraz częściej stosowane są modele chemometryczne [45]. Umożliwiają one skrócenie czasu wykonywania analiz lub całkowite ich zastąpienie pojedynczym, ale kompleksowym pomiarem instrumentalnym. Jest to możliwe dzięki modelowaniu np. nieselektywnych sygnałów analitycznych i informacji uzyskanych z referencyjnych metod analitycznych. Skonstruowany model ułatwia ocenę parametru na podstawie nieselektywnego sygnału bez konieczności prowadzenia uciążliwych analiz chemicznych czy wstępnej preparatyki próbki. Cukier to jeden z produktów spożywczych, którego jakość jest oceniana na podstawie cech wizualnych. Niewielka zawartość takich substancji jak aminokwasy, fenole czy produkty ich reakcji z nieorganicznymi zanieczyszczeniami mogą istotnie wpływać na jego barwę. W przypadku cukru białego jest ona głównym wyznacznikiem jego jakości monitorowanym przez konsumentów. Duża czułości techniki fluorescencyjnej umożliwia detekcję tego typu zanieczyszczeń. W moich badaniach rozpatrywałam możliwość zastosowania fluorescencyjnych obrazów do kontroli jakości cukru. W tym celu skonstruowałam modele chemometryczne kalibrujące zawartość popiołu i barwę cukru w trakcie procesu produkcyjnego. Bazą do utworzenia modeli były fluorescencyjne obrazy próbek oraz oszacowane zabarwienie (badano absorbancje próbek rozpuszczonych w wodzie i doprowadzonych do ph=7, przy długości fali 420 nm) i zawartość popiołu (oznaczone konduktometrycznie). Próbki cukru były pobierane w skandynawskiej cukrowni po ostatnim etapie procesu produkcyjnego (po etapie rafinacji) przez trzy kolejne miesiące. Łącznie, uzyskano 268 reprezentatywnych próbek, z których każda została zbadana pod kątem właściwości fluorescencyjnych (próbki były wzbudzane przy siedmiu długościach fal 230, 240, 255, 290, 305, 325 oraz 340 nm, dla każdej fali wzbudzającej zarejestrowano widmo emisyjne w przedziale od 275 do 560 nm z krokiem pomiarowym 0,5 nm), zabarwienia i zawartości popiołu [46]. 16

Uzyskane dane posłużyły następnie do konstrukcji modeli kalibracyjnych, mających usprawnić proces kontroli jakości cukru. Mając na uwadze pracę z próbkami pochodzącymi z procesu technologicznego, obecność obiektów o odmiennej charakterystyce spektralnej od większości próbek zawartej w zbiorze danych (tzw. obiektów odległych) była brana pod uwagę. Wpływają one na modele kalibracyjne wykorzystujące kryterium najmniejszych kwadratów (MLR, PCR, PLS). Mogą powodować przekrzywienie modelu tj. zmiany współczynników regresji, przez co model nie opisuje dobrze większości próbek (zob. rys. 10). Rys. 10 Poglądowy rysunek wpływu obiektu odległego na model kalibracyjny typu y = ax + b (wykorzystujący kryterium najmniejszych kwadratów) i model stabilny. Chemometria dysponuje stabilnymi metodami kalibracji, tj. nieczułymi na obecność obiektów odległych. Przykładem stabilnej metody kalibracyjnej, która może być użyta do modelowania danych o dużej liczbie skorelowanych zmiennych, jest stabilna M-regresja częściowych najmniejszych kwadratów (ang. partial robust M-regression, PRM) [47]. W metodzie wykorzystuje się stabilne estymatory środka danych (np. mediana) oraz skali (np. estymatory Sn lub Qn) dzięki czemu obecność obiektów odległych nie wpływa na wstępną estymację parametrów modelu. Elastyczny model opisuje dobrze większość danych użytych do jego konstrukcji. Co istotne, w metodzie PRM obiekty odległe nie są usuwane ze zbioru danych. Stosowana jest procedura ważenia (zapewniająca stabilność modelu), tzn. każdemu obiektowi używanemu do konstrukcji modelu przypisywany jest parametr nazywany wagą, który determinuje stopień, w jakim wpływa on na konstruowane współczynniki regresji. Dzięki temu negatywny wpływ obiektów odległych jest niwelowany. Równocześnie wszystkie istotne źródła wariancji zostają uwzględnione w trakcie konstrukcji modelu kalibracyjnego. W celu porównania wyników modelowania uzyskanych metodą klasyczną i stabilną zbudowano modele PLS i PRM. Zbadano również efektywność modelowania przy użyciu metody n-pls. Fluorescencyjne obrazy przygotowano do analizy, usuwając piki rozproszenia promieniowania elektromagnetycznego. Do konstrukcji modeli PLS i PRM sygnały fluorescencyjne rozwinięto, modele n-pls zbudowano używając fluorescencyjnych obrazów 17

zestawionych trójwymiarowy tensor. Próbki tworzące zbiory modelowy i testowy wybrano używając algorytmu Kennard a i Stone a [48], który zapewnia reprezentatywny zbiór modelowy (tzn. zawierający wszystkie możliwe źródła wariancji). Model skonstruowany w oparciu o zbiór reprezentatywny dobrze odwzorowuje różne źródła wariancji, dzięki czemu może być efektywnie stosowany do przewidywania własności próbek o większym zakresie zmienności. Skonstruowane modele porównano pod względem ich dopasowania do danych oraz właściwości predykcyjnych. Wyniki modelowania są przedstawione w poniższej tabeli jako średnie błędy kwadratowe oraz błędy procentowe (obliczone na podstawie rozstępu modelowanych parametrów) dla zbioru modelowego (dopasowanie) i testowego (przewidywanie). Tabela 1 Błędy dopasowania do danych oraz przewidywania uzyskane dla modeli PLS, PRM (założono 5% zawartość obiektów odległych) oraz N-PLS, skonstruowane dla kalibracji koloru i zawartości popiołu. Błędy wyszczególnione kursywą obliczono dla modeli skonstruowanych na podstawie nowych zbiorów modelowych z których usunięto 5% obiektów odległych, zdiagnozowanych przy użyciu modelu PRM; f to kompleksowość modelu (czyli liczba czynników użyta do konstrukcji modelu). Model Kolor Zawartość popiołu PLS 3 N-PLS 3 f Dopasowanie Przewidywanie f Dopasowanie Przewidywanie 1,984 1,307 2,224 1,415 (6,01%) (3,96%) (6,74%) (4,29%) 1,894 1,454 1,933 1,555 (5,74%) (4,41%) (5,86%) (4,71%) 6 5 1,627 1,397 2,264 2,001 (6,51%) (5,59%) (9,06%) (4,29%) 1,822 1,462 2,186 1,711 (7,29%) (5,85%) (8,74%) (6,84%) PRM 3 1,151 (3,49%) 1,178 (3,57%) 6 1,365 (5,41%) 1,417 (5,67%) Porównując parametry dopasowania i przewidywania modeli można wnioskować, że dobrze opisują dane, a wybrana do ich konstrukcji liczba czynników jest optymalna (błędy dopasowania i przewidywania są na porównywalnym poziomie). Najlepsze wyniki modelowania uzyskano używając metody PRM. Pomimo usunięcia z danych obiektów odległych, modele PLS oraz n-pls wykazują większe błędy niż odpowiadające im modele PRM. Usunięcie założonej frakcji obiektów odległych (5%) przed powtórną kalibracją spowodowało słabsze odwzorowanie modelowanego parametru, a w konsekwencji gorsze właściwości predykcyjne modeli. W modelach stabilnych procedura ważenia pozwoliła osiągnąć lepsze właściwości dopasowania i przewidywania. Ze względu na zadowalające właściwości modeli PRM, zaproponowane rozwiązanie może zostać wykorzystane do oceny jakości cukru w trakcie procesu jego produkcji. Jednak aby uzyskać modele, które sprawdzą się w praktyce, należy zbudować je w oparciu od dane fizykochemiczne gromadzone w czasie dłuższym niż trzy miesiące (zapewni to uwzględnienie większej liczby źródeł wariancji i konstrukcję modeli lepiej odwzorowujących monitorowany proces). 18

6.2. Ocena całkowitej zdolności antyoksydacyjnej herbaty rooibos na podstawie danych chromatograficznych Antyoksydanty to związki chemiczne wykazujące zdolność do inhibicji działania wolnych rodników (aktywnych form chemicznych, powodujących degradację m.in. podstawowych budulców organizmów). Antyoksydanty i wolne rodniki są niezbędne do prawidłowego funkcjonowania organizmu, dlatego ilość spożywanych przeciwutleniaczy powinna być monitorowana. Zdolność do przeciwdziałania wolnym rodnikom wykazywana przez wszystkie aktywne antyoksydanty zawarte w próbce, nazywana jest jej całkowitą zdolnością antyoksydacyjną (CZA). Znane są różne chemiczne metody oceny tego parametru (np. FRAP [49], CUPRAC [50], ORAC [51], TEAC [52], DPPH [53]). Wymagają one użycia odczynników chemicznych np. tzw. generatorów wolnych rodników oraz często bywają czasochłonne. Oceny całkowitej zdolności antyoksydacyjnej można również dokonać na podstawie informacji o składzie chemicznym próbki (najczęściej uzyskiwanej na podstawie badań chromatograficznych), sumując zawartości poszczególnych komponentów uznawanych za antyoksydanty. Takie podejście wymaga przeprowadzenia ilościowej analizy wybranych komponentów próbki, z których nie wszystkie są aktywnymi antyoksydantami (tzn. wykazują zdolność do dezaktywacji wolnych rodników). Dodatkowo, ilościowa analiza chromatograficzna wymaga zastosowania wzorców poszczególnych związków chemicznych. Wybór antyoksydantów, które należy oznaczyć ilościowo jest oparty na wiedzy literaturowej, jednak często bywa ograniczony przez dostępność niezbędnych odczynników chemicznych. Z drugiej strony nieselektywne chromatogramy można użyć do konstrukcji modelu kalibracyjnego CZA w badanych próbkach. W moich badaniach wykorzystałam dane chromatograficzne, HPLC-DAD (zarejestrowane dla naparów herbaty rooibos wyprodukowanej w latach 2009, 2010 i 2011, pochodzącej z czterech klas jakości: A, B, C oraz D) oraz informacje o całkowitej zdolności antyoksydacyjnej próbek (wyznaczone za pomocą znanych z literatury metodyk analitycznych testy ORAC oraz DPPH) do konstrukcji modeli kalibracyjnych, ułatwiających ocenę CZA. Wartości CZA oznaczone z pomocą testów ORAC i DPPH podano w tzw. równoważnikach Troloxu (RT), czyli mg Troloxu (rozpuszczalnego w wodzie analogu witaminy E) na 100 g próbki. Wykorzystałam dwa typy danych chromatograficznych: chromatogramy HPLC-DAD oraz tabelę pików reprezentującą stężenia dwunastu polifenoli, które uznawane są za najważniejsze antyutleniacze zawarte w herbacie rooibos (kwas fenylopirogronowy, aspalathin, nothofagin, izoorientyna, orientyna, kwas felurowy, kwercetyno-3-robinobiozyd, witeksyna, hyperozyd, rutyna, izoviteksyna i izokwercytyna). Chromatogramy DAD to dwuwymiarowe sygnały, ich modelowanie wymaga dużej mocy obliczeniowej i czasu. W celu usprawnienia analizy uśredniono intensywności absorpcji zarejestrowane dla poszczególnych długości fali, dzięki czemu każda próbka była opisana przez reprezentatywny sygnał jednowymiarowy. Uśrednione chromatogramy DAD poddano wstępnemu przygotowaniu: przesunięte piki nałożono oraz usunięto linię bazową. 19

CZA oznaczoną metodami ORAC oraz DPPH (wykorzystując metodę PLS) modelowano w oparciu o tabelę pików oraz chromatogramy. Efektem modelowania są modele o optymalnym dopasowaniu do danych i właściwościach przewidywania (parametry modeli przedstawiono w Tabeli 2). Tabela 2 Parametry modeli PLS o optymalnej kompleksowości, kalibrujących całkowitą zdolność antyoksydacyjną. Błędy dopasowania i przewidywania wyrażono jako średni błąd kwadratowy obliczony na podstawie RT. Dopasowanie DPPH Przewidywanie Dane f RMSE % RMSEP % Tabela pików 6 273 10,8 363 14,4 Chromatogramy 8 198 7,84 275 10,9 ORAC Tabela pików 8 1108 12,2 1489 16,3 Chromatogramy 11 803 8,82 1359 14,9 Właściwości predykcyjne modeli kalibracyjnych, skonstruowanych na podstawie chromatogramów, są lepsze niż tych skonstruowanych dla tabeli pików. Użyta metoda modelowania umożliwiła włączenie dodatkowych informacji o antyoksydantach do konstruowanego modelu, bez konieczności ich ilościowego oznaczenia. Nieselektywne sygnały, użyte do konstrukcji modeli PLS zawierają więcej informacji o antyoksydantach niż tabela pików. W dalszym etapie badań istotne jest określenie, które z oznaczonych ilościowo polifenoli mają wkład w CZA herbaty rooibos. Nieistotne polifenole wyeliminowano z danych używając metody regresji częściowych najmniejszych kwadratów z eliminacją nieinformatywnych zamiennych (ang. uninformative variable selection partial least squares, UVE-PLS) [54]. Analiza wykazała, że pięć z dwunastu polifenoli (aspalathin, kwas felurowy, rutyna, izowiteksyna i izokwercytyna) nie jest wykorzystywanych podczas modelowania CZA, bez względu na to czy modelowanym parametrem jest DPPH czy ORAC. Postulowany charakter pięciu polifenoli może być wynikiem sposobu produkcji badanej herbaty. Proces pasteryzacji, suszenie czy warunki przechowywania mogą mieć wpływ na aktywność wymienionych komponentów. Dlatego pomimo literaturowych informacji o ich aktywności antyoksydacyjnej ich zawartości nie wykazują korelacji z modelowanymi wartościami CZA. W badaniach prowadzonych w przyszłości ilościowe oznaczenie tych polifenoli może zostać pominięte. Praktyczna stosowalność proponowanego rozwiązania w rutynowych analizach również została sprawdzona. Skonstruowano modele kalibracyjne dla próbek zebranych w danym roku produkcyjnym i oceniono ich właściwości predykcyjne dla próbek zebranych w innych latach. 20

Tabela 3 Parametry dopasowania i przewidywania modeli PLS o optymalnych właściwościach, kalibrujące całkowitą zdolność antyoksydacyjną wyznaczoną metodą DPPH na podstawie chromatogramów. Próbki w zbiorze Próbki w zbiorze Dopasowanie Przewidywanie f modelowym testowym RMSE % RMSEP % 2009 i 2010 2011 8 184 7,28 322 12,7 2009 i 2011 2010 8 205 8,12 310 12,3 2010 i 2011 2009 8 178 7,05 412 16,3 Analiza wyników zamieszczonych w Tabeli 3 wykazuje, że skonstruowane modele kalibracyjne są dobrze dopasowane do danych włączonych do poszczególnych zbiorów modelowych. Jednak parametry przewidywania modeli w porównaniu z parametrami dopasowania w każdym z przypadków są większe (tzn. modele dobrze odwzorowują właściwości próbek ze zbiorów modelowych, ale ich właściwości przewidywania są niezadowalające). Może to być przyczyną zmienności próbek wywołanej czynnikami naturalnymi, których wahania obserwowane są na przestrzeni lat. Nie bez znaczenia jest również wariancja związana z miejscem produkcji herbaty. W trakcie zbierania próbek, dołożono starań aby były one tej samej jakości (A, B, C oraz D), jednak producenci dostarczający materiał do badań w trzech kolejnych latach byli różni. Spowodowało to różnice odzwierciedlające się w parametrach przewidywania modeli prezentowanych w Tabeli 5. Aby modele były użyteczne w kolejnych latach produkcyjnych należy dokonywać ich aktualizacji, uwzględniając zmienność próbek zależną od roku produkcyjnego, jak również zwracając uwagę na wariancję związaną z pochodzeniem geograficznym badanego produktu. 6.3. Ocena jakości oleju napędowego pod względem zawartości dodatków akcyzowych Olej napędowy to paliwo, które w zależności od przeznaczenia jest obłożone podatkiem akcyzowym różnej wysokości. W celu obniżenia kosztów ogrzewania, produkcji rolnej czy transportu morskiego, akcyza na olej napędowy dedykowany do tych zastosowań jest niższa od tej nakładanej na paliwo wykorzystywane do transportu samochodowego. Rozróżnienia olejów napędowych ze względu na nałożony podatek dokonuje się, wprowadzając komponenty zmieniające fizyczne właściwości tych, które mają niższą akcyzę. Zgodnie z polskim prawem [55] do paliw wprowadzane są dwa komponenty znacznik i barwnik. Jako znacznik używa się tej samej substancji dla wszystkich znaczonych paliw. Jest nią diazowy związek o nazwie Solvent Yellow 124. Używane barwniki to również substancje diazowe. Są one różne w zależności od przeznaczenia paliwa. Oleje opałowe i przeznaczone do produkcji rolnej barwione są na czerwono przy użyciu dwóch barwników Solvent Red 19 i Solvent Red 164 (barwniki używane są zamiennie). Olej używany do transportu morskiego barwiony jest niebieskim barwnikiem Solvent Blue 35. Wszystkie komponenty akcyzowe powinny być wprowadzone do oleju napędowego w ściśle określonym stężeniu, 21

regulowanym przez Rozporządzenie Ministra Finansów z dnia 20 sierpnia 2010 r. [55]. Ze względu na znaczne różnice w cenie oleju o obniżonej i regularnej akcyzie, obserwuje się nielegalne wykorzystanie zabarwionego oleju. Komponenty akcyzowe są usuwane z oleju o obniżonym podatku, a następnie oczyszczony olej sprzedawany jest na stacjach benzynowych po wyższej cenie. Zważywszy rangę problemu jak i zakres ekonomicznego oddziaływania procederu odbarwiania paliw, podjęłam próbę opracowania nowatorskiej metodyki analitycznej. Jej celem jest prosta i szybka ocena tego czy olej napędowy używany jest zgodnie z jego pierwotnym przeznaczeniem. Skupiłam się na dwóch celach badawczych: Cel (1): Opracowanie metody analitycznej, która ułatwi oznaczenie stężenia znacznika (Solvent Yellow 124) oraz barwnika (Solvent Red 19) w matrycy oleju napędowego. Cel (2): Opracowanie metody pozwalajacej ocenić czy olej napędowy został pozbawiony komponentów akcyzowych. Oznaczane komponenty akcyzowe to substancje diazowe (wzory strukturalne barwnika i znacznika przedstawiono na rys. 11), wykazujące zdolność do fluorescencji, ale posiadające odmienną charakterystykę spektralną. Te własności są powodem wykorzystania fluorescencyjnych obrazów w przeprowadzonych badaniach. Rys. 11 Wzory strukturalne barwnika Solvent Red 19 i znacznika Solvent Yellow 124. W celu rozwiązania podjętych problemów badawczych eksperyment był prowadzony według opracowanego planu. Przygotowano serię próbek niebarwionego oleju napędowego, do którego wprowadzono znacznik (Solvent Yellow 124) oraz barwnik (Solvent Red 19) w ustalonych stężeniach (wahających się w przedziale 0 10 mg L -1 ). Tak przygotowane próbki zbadano pod kątem właściwości fluorescencyjnych (wybierając zakres wzbudzenia z przedziału 250-700 nm z krokiem pomiarowym 10 nm oraz emisji z przedziału 350-800 nm z krokiem pomiarowym 2 nm). Następnie z próbek usunięto wcześniej wprowadzone komponenty akcyzowe wykorzystując czynnik sorbujący. Po filtracji ponownie zarejestrowano fluorescencyjne obrazy w podanym zakresie wzbudzenia i emisji. W efekcie uzyskano zbiór widm synchronicznych próbek zabarwionych i odbarwionych, a także informację o stężeniu komponentów akcyzowych w każdej ze zbadanych próbek. Dane eksperymentalne przygotowano do analizy, usuwając z widm piki rozproszenia promieniowania elektormagnetycznego, a następnie interpolując naruszone obszary sygnałów. 22

Pierwszy cel badawczy oporacowanie modelu ułatwiającego ocenę stężeń barwnika i znacznika. Wykorzystując widma zabarwionego oleju napędowego oraz informacje o stężeniach barwnika i znacznika w przygotowanych próbkach, skonstruowałam modele kalibracyjne PLS i n-pls. Stężenia znacznika i barwnika były modelowane oddzielnie, czego efektem są cztery modele kalibracyjne. Błędy dopasowania i przewidywania modeli przedstawiono w Tabeli 4). Tabela 4 Parametry dopasowania i przewidywania modeli kalibrujących stężenie znacznika Solvent Yellow 124 i barwnika Solvent red 19 w matrycy oleju napędowego, skonstruowane przy użyciu metod regresji częściowych najmniejszych kwadratów (PLS) i n-modelnej regresji częsciowych najmniejszych kwadratów (n-pls). metoda PLS N-PLS komponent dopasowanie przewidywanie dopasowanie przewidywanie SR19 0,175 0,189 0,174 0,184 SY124 0,237 0,257 0,206 0,221 Modele zbudowane przy użyciu metody PLS charakteryzowały się podobnymi wartościami błędów dopasowania i przewidywania jak modele n-pls. Konstrukcja modelu PLS jest koncepcyjnie prostsza, dlatego też analityczna walidacja opracowanej procedury została przeprowadzona dla modeli PLS. Uzyskane limity detekcji dla znacznika i barwnika wynoszą odpowiednio 0,048 oraz 0,042 mg L -1. Opracowana procedura jest stabilna w czasie i charakteryzuje się niską wartością względnego odchylenia standardowego zarówno dla oznaczania Solvent Yellow 124 (RSD = 2,33%) jak i Solvent Red 19 (RSD = 3,23%). W kontekście oznaczenia komponentów akcyzowych, fluorescencyjne obrazy są sygnałami niespecyficznymi, dlatego uzyskane wartości parametrów walidacyjnych są nieco wyższe, niż metody referencyjnej, wykorzystującej rozdział chromatograficzny (HPLC) [56]. Z drugiej strony, niedestrukcyjny charakter proponowanych pomiarów, możliwość przeprowadzenia badań poza laboratorium oraz niski koszt analizy sprawiają, że proponowana metoda jest atrakcyjna i może znaleźć praktyczne zastosowania. Proponowana metoda jest przedmiotem zgłoszenia patentowego nr P.339194. Drugi cel badawczy opracowanie metody ułatwiającej dyskryminację odbarwionego oleju napędowego, ze względu na zawartość komponentów akcyzowych Rozróżnienia oleju napędowego o obniżonej i podwyższonej akcyzie poddanego procederowi odbarwienia dokonano na podstawie fluorescencyjnych obrazów próbek odbarwionych. Dostępne próbki podzielono biorąc pod uwagę ich przynależność do jednej z dwóch klas, tj. próbki o regularnej i obniżonej akcyzie. Ze względu na przyjęty plan eksperymentu oraz uwarunkowania prawne zdefiniowane we wcześniej przytoczonym dokumencie [55] rozpatrywano cztery możliwe kryteria dyskryminacji próbek (por. rys. 12): 23

n1 kryterium dyskryminacyjnym jest stężenie znacznika; n2 kryterium dyskryminacyjnym jest stężenie barwnika; n3 o przynależności próbki do jednej z dwóch klas decyduje równocześnie stężenie barwnika i znacznika oraz n4 o przynależności próbki do jednej z dwóch klas decyduje stężenie barwnika lub znacznika. Stezenie [mg L -1 ] SY124 0 0 0 0 2 2 2 4 4 5 5 5 7 7 7 9 9 10 10 10 SR19 0 2 5 10 0 2 7 3 8 0 5 10 0 2 7 3 8 0 5 10 n 1-1 -1-1 -1-1 -1-1 -1-1 -1-1 -1 1 1 1 1 1 1 1 1 n 2-1 -1-1 1-1 -1 1-1 1-1 -1 1-1 -1 1-1 1-1 -1 1 n 3-1 -1-1 -1-1 -1-1 -1-1 -1-1 -1-1 -1 1-1 1-1 -1 1 n 4-1 -1-1 1-1 -1 1-1 1-1 -1 1-1 -1 1-1 1-1 1 1 Rys. 12 Plan eksperymentu wraz z czterema kryteriami dyskryminacyjnymi; -1 próbka o regularnej akcyzie, 1 próbka o obniżonej akcyzie. Analiza eksploracyjna rozwiniętych fluorescencyjnych obrazów przeprowadzona z użyciem analizy czynników głównych (PCA) wskazuje na dużą liczbę zmiennych skorelowanych. Pierwsze dwa czynniki główne opisują 99,05% całkowitej wariancji danych. Rozproszenie próbek, obserwowane na płaszczyźnie zdefiniowanej przez pierwszy i drugi czynnik główny (PC1/PC2), sugeruje, że kryterium dyskryminacyjne n1 może dać najlepsze efekty dyskryminacji próbek (zob. rys. 13). 24