ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA dr inż. Aleksander Astel Gdańsk, 22.12.2004
CHEMOMETRIA dziedzina nauki i techniki zajmująca się wydobywaniem użytecznej informacji z wielowymiarowych danych pomiarowych wykorzystująca: matematykę rachunek podobieństwa statystykę metody numeryczne teorię podejmowania decyzji techniki wizualizacji
OBSZARY WYKORZYSTANIA TECHNIK CHEMOMETRYCZNYCH PROBLEM PROJEKTOWANIE DOŚWIADCZENIA WYKONANIE POMIARÓW PRZECHOWYWANIE I ANALIZA WYNIKÓW MODEL ZALEŻNOŚCI ANALIZA WIZUALNA KLASYFIKACJA ANALIZA PODOBIEŃSTWA PROGNOZOWANIE OPTYMALIZACJA KONTROLA
KONTROLA DANYCH wyeliminowanie pomyłek powstałych w trakcie przygotowywania danych, czyli tzw. błędów grubych ; wykrycie w zbiorze danych obiektów różniących się istotnie od innych, czyli tzw. punktów odbiegających; uzyskanie przesłanek do ewentualnej transformacji niektórych zmiennych; określenie jednorodności zbioru danych, czyli potwierdzenia pochodzenia wszystkich danych z tej samej populacji.
KONTROLA DANYCH MINIMUM MAXIMUM MIN/MAX (wartość bezwzględna tego stosunku mniejsza od 0,1 świadczy o braku rozkładu normalnego) ROZSTĘP ROZKŁADU r = MAX - MIN ŚRODEK ROZKŁADU d = (MAX - MIN)/2 WARTOŚĆ ŚREDNIA (powinna znajdować się w środku rozkładu) ODCHYLENIE STANDARDOWE SD SKOŚNOŚĆ ROZKŁADU q (dla rozkładu normalnego wynosi ona 0, im większa wartość tym większa asymetria)
KONTROLA DANYCH PUNKTY ODBIEGAJĄCE TEST Q-DIXONA TEST T-STUDENTA REGUŁA TRZECH SIGM TRANSFORMACJA doprowadzenie rozkładu zmiennej do rozkładu zbliżonego do rozkładu normalnego uzyskanie liniowej zależności pomiędzy zmienną zależną i objaśniającą log(x), log(x+a), log(x-a)
BRAKUJĄCE DANE ZAPLANOWANA PRÓBKA NIE ZOSTAŁA PODDANA ANALIZIE przyczyną może być np. zanieczyszczenie lub zniszczenie próbki o ile to tylko możliwe próbka powinna być pobrana ponownie, jeżeli nie jest to możliwe należy odpowiednio zmodyfikować plan doświadczenia
BRAKUJĄCE DANE - cd WYKONANO OZNACZENIA TYLKO NIEKTÓRYCH ANALITÓW dużo braków => próbkę odrzucić i postępować jak w przypadku braku próbki; braki dotyczą pojedynczych analitów => rozważyć usunięcie z planu doświadczenia analitu, którego braki dotyczą
BRAKUJĄCE DANE - cd STĘŻENIE ANALITÓW MNIEJSZE NIŻ GRANICA OZNACZALNOŚCI STOSOWANEJ METODY ANALITYCZNEJ sytuacja częsta => zastosować inną metodę oznaczeń analitu o niższej granicy oznaczalności sytuacja sporadyczna => przyjmuje się dla brakujących pomiarów wartość równą ½ granicy oznaczalności metody
ANALIZA WARIANCJI (ANOVA) podstawowe narzędzie tzw. statystyki eksperymentalnej; służy do oceny wpływów pewnych kontrolowanych czynników na wynik doświadczenia; statystyczna analiza pozwalająca na ocenę różnic wielu średnich test F-Snedeckora jako kryterium decyzyjne
ANALIZA WARIANCJI (ANOVA) ZMIENNOŚĆ WEWNĄTRZGRUPOWA GRUPA1 ZMIENNOŚĆ MIĘDZYGRUPOWA GRUPA3 GRUPA2
ANALIZA WARIANCJI (ANOVA) przykład Badano zawartość THM [ug/dm 3 ] w wodzie pitnej w trzech źródłach głębinowych w rejonie Trójmiasta. G1 : 35, 40, 32, 40, 41, 39 (średnia = 37,8 ug/dm 3 ) G2 : 35, 48, 42, 48, 45 (średnia = 43,6 ug/dm 3 ) G3 : 32, 39, 42, 32, 35, 40 (średnia = 36,7 ug/dm 3 ) Hipoteza zerowa: nie występują statystycznie istotne różnice w średniej zawartości THM w wodzie pitnej na terenie Trójmiasta.
ANALIZA WARIANCJI (ANOVA) przykład - cd
ANALIZA WARIANCJI (ANOVA) przykład - cd wyznaczono sumę kwadratów oznaczeń wartości stężeń THM dla poszczególnych źródeł oraz pomiędzy nimi wartość F (p=0,05) dla odpowiedniej ilości stopni swobody (f=2) = 3,739 < 3,776 Należy odrzucić hipotezę zerową i przyjąć, że średnie stężenie THM w próbkach wody pitnej różni się w poszczególnych dzielnicach Trójmiasta.
ANALIZA GŁÓWNYCH SKŁADOWYCH (PCA) chemometryczna strategia przeznaczona do analizowania wielowymiarowych zbiorów wyników, zmniejszenie liczby zmiennych bez istotnej straty zawartych w nich informacji (funkcja redundacyjna), porządkowanie i klasyfikacja obiektów w ortogonalnych przestrzeniach czynnikowych (funkcja delimitacyjna)
ANALIZA GŁÓWNYCH SKŁADOWYCH (PCA) zmienne: I, II, III,... przypadek A x 1, x 2, x 3,..., x n-1, x n, x n+1 przypadek B y 1, y 2, y 3,..., y n-1, y n, y n+1 przypadek C z 1, z 2, z 3,..., z n-1, z n, z n+1
ANALIZA GŁÓWNYCH SKŁADOWYCH (PCA) zmienne: I, II, III,... przypadek A x 1, x 2, x 3,..., x n-1, x n, x n+1 przypadek B y 1, y 2, y 3,..., y n-1, y n, y n+1 przypadek C z 1, z 2, z 3,..., z n-1, z n, z n+1
ANALIZA GŁÓWNYCH SKŁADOWYCH (PCA) zmienne: I, II, III,... Wartość cechy (wyrażona w odpowiednich przypadek A x 1, x 2, x 3,..., x n-1, x n, x n+1 jednostkach) przypadek B y 1, y 2, y 3,..., y n-1, y n, y n+1 przypadek C z 1, z 2, z 3,..., z n-1, z n, z n+1 Badane obiekty (np. próbki) Nazwa badanej cechy obiektu
ANALIZA GŁÓWNYCH SKŁADOWYCH (PCA) PC3 PC1 PC2
WŁASNOŚCI GŁÓWNYCH SKŁADOWYCH liniowe kombinacje analizowanych zmiennych ortogonalne względem siebie kolejne składowe wyjaśniają malejącą ilość łącznej wariancji zmiennych możliwość interpretacji naukowej (chemicznej, fizycznej lub biologicznej) wyodrębnionych głównych składowych
Jony SO 2-4 pochodzące z emisji tlenków siarki do atmosfery łączą się z jonami K +, Ca i CaSO 4 są deponowane do podłoża wraz z opadami atmosferycznymi ANALIZA, CaGŁÓWNYCH SKŁADOWYCH 2+, Mg 2+ i w postaci K 2 SO 4, MgSO 4 i CaSO (PCA) przykład Liczba czynników % wariancji skumulowanej Liczba czynników % wariancji skumulowanej 5 72,3% 5 77,2% sezon zimowy I I czynnik 27% (ph, L, SO 2-4, Mg 2+, Ca 2+ II czynnik 13,6 % (V, NH 4+ ) III czynnik 13,3% (NH 4+, Cl -, K + ) IV czynnik 10,0% (PO 3-4, F - ) sezon zimowy II 2+ ) I czynnik 32,2% (SO 2-4, Cl -, K +, Mg 2+, Ca 2+ II czynnik 15,6% (V, NO 3-, NH 4+ ) III czynnik 12,5% (PO 3-4, F -, Mg 2+ ) 2+ ) Liczba czynników % wariancji skumulowanej 5 85,3% sezon letni I I czynnik 39,9% (SO 2-4, NH 4+, K +, Mg 2+, Ca 2+ II czynnik 17,5% (ph, PO 3-4, SO 2-4, F - ) II czynnik 11,8% (NO 3-, Cl - ) 2+ )
Przypuszcza się, że współwystępowanie jest spowodowane działalnością produkcyjną Gdańskich Zakładów ANALIZA GŁÓWNYCH SKŁADOWYCH Nawozów Fosforowych Fosfory S.A. (PCA) przykład Liczba czynników % wariancji skumulowanej Liczba czynników % wariancji skumulowanej 5 72,3% 5 77,2% sezon zimowy I I czynnik 27% (ph, L, SO 2-4, Mg 2+, Ca 2+ II czynnik 13,6 % (V, NH 4+ ) III czynnik 13,3% (NH 4+, Cl -, K + ) IV czynnik 10,0% (PO 3-4, F - ) sezon zimowy II 2+ ) I czynnik 32,2% (SO 2-4, Cl -, K +, Mg 2+, Ca 2+ II czynnik 15,6% (V, NO 3-, NH 4+ ) III czynnik 12,5% (PO 3-4, F -, Mg 2+ ) 2+ ) Liczba czynników % wariancji skumulowanej 5 85,3% sezon letni I I czynnik 39,9% (SO 2-4, NH 4+, K +, Mg 2+, Ca 2+ II czynnik 17,5% (ph, PO 3-4, SO 2-4, F - ) II czynnik 11,8% (NO 3-, Cl - ) 2+ )
Ograniczona możliwość uwalniania jonów NH 4+ z próbki wodnej w postaci NH ANALIZA z próbki wodnej GŁÓWNYCH w postaci NHSKŁADOWYCH 3 w sezonie zimowym (PCA) przykład Liczba czynników % wariancji skumulowanej Liczba czynników % wariancji skumulowanej 5 72,3% 5 77,2% sezon zimowy I I czynnik 27% (ph, L, SO 2-4, Mg 2+, Ca 2+ II czynnik 13,6 % (V, NH 4+ ) III czynnik 13,3% (NH 4+, Cl -, K + ) IV czynnik 10,0% (PO 3-4, F - ) sezon zimowy II 2+ ) I czynnik 32,2% (SO 2-4, Cl -, K +, Mg 2+, Ca 2+ II czynnik 15,6% (V, NO 3-, NH 4+ ) III czynnik 12,5% (PO 3-4, F -, Mg 2+ ) 2+ ) Liczba czynników % wariancji skumulowanej 5 85,3% sezon letni I I czynnik 39,9% (SO 2-4, NH 4+, K +, Mg 2+, Ca 2+ II czynnik 17,5% (ph, PO 3-4, SO 2-4, F - ) II czynnik 11,8% (NO 3-, Cl - ) 2+ )
ANALIZA SZEREGÓW CZASOWYCH statystyczna analiza zależności pomiędzy kolejnymi wartościami zmiennej przewidywanie (prognozowanie) przyszłych wartości szeregu czasowego wykrywanie mechanizmów rządzących zmianami obserwowanego zjawiska w czasie (np. identyfikacja oraz określenie długości cyklu zmian określonego zjawiska)
ANALIZA SZEREGÓW CZASOWYCH SZUM
ANALIZA SZEREGÓW CZASOWYCH TRANSFORMACJA FOURIERA DŁUGOŚĆ OKRESU ZMIAN 12 MIESIĘCY
LOGIKA W CHEMOMETRII LOGIKA KLASYCZNA LOGIKA ROZMYTA
PODSUMOWANIE efektywne wykorzystanie zabranych danych pomiarowych w wyniku zwiększenia ilości uzyskiwanych informacji możliwość wnioskowania o problemach w ujęciu wielowymiarowym optymalizacja rachunku ekonomicznego analiz działalnośc prośrodowiskowa (ograniczenie ilości odczynników wprowadzonych do środowiska naturalnego w skali globalnej)