autorzy: Stanisław Koter, Klaudia Wesołowsa 2 Uniwersytet Miołaja Kopernia, Toruń, 2 Politechnia Śląsa, Gliwice Zastosowanie metody PCA do opisu wód naturalnych W niniejszej pracy przedstawiono zastosowanie metody PCA do opisu wód naturalnych. Stwierdzono, że metoda ta pozwala na jednoznaczne rozróżnienie wód pochodzących z różnych ujęć w przestrzeni 2D. Umożliwia ona taże na identyfiację próbe odbiegających od pozostałych tego samego pochodzenia.. Wprowadzenie W obecnych czasach jaość wód przeznaczonych do celów onsumpcyjnych i na potrzeby gospodarcze powinna odpowiadać nie tylo wymogom Rozporządzenia MZ i OS, ale przede wszystim wygórowanym oczeiwaniom odbiorców. W Polsce pobiera się wodę do picia z dwóch zasadniczych źródeł tj. z zasobów powierzchniowych i podziemnych. Wobec postępującej degradacji środowisa i zanieczyszczenia wód powierzchniowych znaczenie wód podziemnych jao źródła wody pitnej stale wzrasta. Ponieważ wody naturalne charateryzuje szereg parametrów oreślających ich sład jonowy, a zarazem sma, stąd bardzo ważną rolę odgrywa stały monitoring jaości uzdatnianych wód. Niniejsza praca ma na celu prezentację metody PCA (principal component analysis) w zastosowaniu do opisu monitorowanych wód naturalnych. PCA pozwala przedstawić zasób informacji zawarty w wielu zmiennych przy pomocy niewieliej liczby czynniów. Dzięi temu możliwa jest analiza danych w przestrzeni 2D lub 3D [,2,3]. Podjęto próbę rozważenia zagadnienia, czy próbi wody pochodzące z różnych źródeł i pobierane w różnym czasie mają swoją szczególną cechę (charaterystyę) pozwalającą na identyfiację z danym źródłem. 2. Metodya Badaniom poddano twarde wody studzienne (pochodzące z Gliwic, Jaworzna i Będzina), charateryzujące się zróżnicowanym sładem jonowym, oraz dodatowo wodę wodociągową. Wyonując oznaczenia 8 parametrów, tj. twardości ogólnej, węglanowej, węgla nieorganicznego, wapnia, magnezu, sodu, chlorów, siarczanów oreślono stężenia tych jonów w próbach wód pobieranych w różnych oresach czasu. Stężenie magnezu, wapnia oraz oznaczenie twardości ogólnej i wyonano miareczową metodą omplesometryczną z EDTA, natomiast stężenie chlorów oznaczono metodą miareczową Mohra. Również metoda miareczowa posłużyła do oznaczenia twardości węglanowej. Zawartość siarczanów oznaczono za pomocą Merc a SQ 8, a sód w badanych wodach mierzono za pomocą fotometru płomieniowego Flapho. Węgiel nieorganiczny oznaczono za pomocą analizatora węgla i azotu Multi N/C.
3. Opis metody PCA [,2,3] Niech wiersze macierzy danych X (n x m) odpowiadają próbom, a olumny - zmiennym objaśniającym te próbi. Jeśli macierz orelacji X tych zmiennych nie jest diagonalna, oznacza to, że są one ze sobą sorelowane, a zatem część informacji wnoszona przez ażdą zmienną objaśniającą jest powtórzeniem informacji wnoszonej przez pozostałe zmienne. Należy zatem znaleźć nowe, niesorelowane zmienne, związane liniowo ze zmiennymi pierwotnymi. Ponieważ zmienne pierwotne mogą mieć różny charater fizyczny, a taże różnić się znacznie samymi wartościami, poddaje się je przedtem autosalowaniu: z i = ( xi x ) / s i=,..,n; =,..,m () gdzie x i, z i, są odpowiednio elementami macierzy danych przed i po standaryzacji, x - średnią elementów w -tej olumnie, s - odchyleniem standardowym. Problem polega zatem na wyrażeniu macierzy autosalowanych danych Z w postaci iloczynu: Z = TP (2) gdzie P jest transponowaną macierzą P (m x m), zwaną loading matrix, a T jest macierzą szuanych niesorelowanych zmiennych, zwaną score matrix. Wobec brau orelacji iloczyn T T winien dawać macierz diagonalną. Na tej podstawie można wyazać, że olumny macierzy P, p, są wetorami własnymi macierzy owariancji cov(z): cov( Z) p = Z Zp = λp (3) n gdzie λ jest wartością własną macierzy cov(z), odpowiadającą wetorowi p, i jest miarą ilości wariancji danych opisywanej przez -tą olumnę macierzy T, t : t = λ = t t = var( t ) (4) n Ze względu na ortogonalność macierzy P (P P=I) można zapisać: t = Zp (5) Zgodnie z tym równaniem p oreśla, jaą ombinacją autosalowanych zmiennych wyjściowych jest -ta główna sładowa. Kolumny T, t, są wzajemnie ortogonalne i zawierają współrzędne poszczególnych próbe w nowej przestrzeni tzw. głównych sładowych, tóre przyjęto oznaczać jao PC, PC2,.... Pierwsza główna sładowa zawiera najwięszą wariancję (zmienność) początowego zestawu danych, ażda następna sładowa coraz mniejszą. W zależności od rodzaju problemu można przyjąć, że istotne są te pierwsze sładowe, tóre zawierają 9-95% zmienności danych, pozostałe sładowe się pomija (wówczas Z = TP + E, gdzie E jest macierzą reszte). Dzięi temu prezentacja graficzna i analiza danych staje się znacznie łatwiejsza. 4. Dysusja wyniów i wniosi Minimalne i masymalne wartości parametrów uzysane w analizowanych próbach wód przedstawiono na rys..
8 6 Tog [mgcaco 3 /L] Cl - [mg/l] SO 4 2- [mg/l] Tw [mg/l] min, max 4 2 25 2 ww Jaworzno Będzin Gliwice IC [mg/l] Na + [mg/l] Mg 2+ [mg/l] Ca 2+ [mg/l] woda min, max 5 5 ww Jaworzno Będzin Gliwice woda Rys.. Zestawienie minimalnych i masymalnych wartości parametrów uzysanych w przeprowadzonych analizach wód studziennych i wodociągowej
Analizując przedstawione dane można stwierdzić, iż trudno jest ustalić parametr, tóry pozwalałby na jednoznaczne rozróżnienie analizowanych wód. Niewątpliwie woda wodociągowa (ww) charateryzuje się niewielimi wartościami parametrów w porównaniu z wodami studziennymi, w obrębie tórych nisą zawartość Mg 2+ wyazuje woda z Gliwic (porównywalną jedna z ww). Ta więc jednoznaczne oreślenie pochodzenia próbi wody wcale nie jest taie proste. Zestawienie współczynniów orelacji pomiędzy poszczególnymi parametrami (zmiennymi objaśniającymi) prezentuje tab.. Tab.. Macierz orelacji parametrów wody (zmiennych objaśniających), równa macierzy owariancji parametrów po autosalowaniu cov( Z ) = Z Z /( n ) T og [CaCO 3 ] Cl- -- SO 4 T w IC Na + Mg ++ Ca ++ T og [CaCO 3 ] Cl -.569 -- SO 4.946.73 T w.956.648.886 IC.85.746.824.937 Na +.44.39.594.227.223 Mg ++.64.96.656.44.43.869 Ca ++.897.596.86.955.829.6.2 Jest widoczne, że pomiędzy tymi parametrami występuje silna orelacja (np. między T og a SO 4 2- czy T w ), a zatem ja najbardziej uzasadnione jest przeprowadzenie analizy głównych sładowych. W tab.2 zestawiono wariancje głównych sładowych, λ, oraz ich procentowy udział w zmienności zestawu danych. Tab.2. Wariancja głównych sładowych i ich %-wy udział w zmienności zestawu danych PC (t ) Wariancja λ % udziału 5.528 69. 2.627 2.3 3.592 7.4 4.95 2.4 5.32.4 6.23.29 7.25.3 8 8.2-8. Jest widoczne, że pierwsze trzy sładowe objaśniają prawie 97% zmienności zawartej w danych, przy czym pierwsza sładowa objaśnia ponad 2/3 zmienności. A zatem do opisu badanych próbe wody wystarczą 2-3 pierwsze główne sładowe.
a) 2 Gliwice PC2 ww Będzin - -2 Jaworzno -4-2 2 PC 2 b) Jaworzno PC3 ww Gliwice - Będzin -2-4 -2 2 PC c) Jaworzno Gliwice PC3 ww - Będzin -2-2 PC2 Rys.2. Rzut próbe na płaszczyznę głównych sładowych: a) PC-PC2, b) PC-PC3, c) PC2-PC3.
Na rys.2 przedstawiono próbi wody wyreślone na płaszczyźnie dwóch spośród trzech pierwszych sładowych ( a) PC-PC2, b) PC-PC3 i c) PC2-PC3). Jest widoczne, że rzut próbe na płaszczyznę PC-PC2 pozwala na wyraźne rozróżnienie próbe, jeśli chodzi o źródło ich pochodzenia. W przypadu PC-PC3, ja również PC2-PC3, można dostrzec wyraźnie odbiegającą próbę w przypadu wody z Gliwic. Przyczyną tej rozbieżności może być błąd w analizie, a jeśli to nie wchodzi w rachubę, to chwilowa zmiana w sładzie wody wyniająca nieoniecznie z przyczyn naturalnych. Udział poszczególnych parametrów w głównych sładowych przedstawiają wetory p (r.(5), rys.3). Zgodnie z danymi, przedstawionymi na rys.3, przybliżony sens fizyczny głównych sładowych jest następujący: PC charateryzuje całowitą zawartość wszystich sładniów wody, natomiast PC2 jest ombinacją przede wszystim stężeń ationów..6.4 sładowe p, p 2, p 3.2. -.2 -.4 -.6 -.8 p - PC p 2 - PC2 p 3 - PC3 Tog Cl- SO4-- Tw IC Na+ Mg++ Ca++ Rys.3. Sładowe wetorów p, p 2 i p 3 transformujących autosalowane parametry wody w główne sładowe PC, PC2, PC3 (r.(5)) Podsumowując, zastosowana metoda PCA spełnia swoje zadanie przyporządowania otrzymanych wyniów do odpowiednich źródeł poboru wód. Pozwala ona taże na identyfiację próbe odbiegających od pozostałych tego samego pochodzenia. Rozbieżności te mogą; być spowodowane oresowymi wahaniami sładu ujmowanych wód, a nawet wsazywać na chwilowe ich zanieczyszczenia. 5. Literatura. Mazersi J., Podstawy chemometrii, Wyd. Politechnii Gdańsiej, Gdańs, 2. 2. Beebe K.R., Pell R.J., Seasholtz M.B., Chemometrics. A practical guide, J. Wiley & Sons, Inc., New Yor, 998. 3. Wise B.M., Gallagher N.B., J. Proc. Cont. 6(996)329.