Kamil JANIAK, Piotr BALBIERZ, Marta KNAP * analiza statystyczna danych eksploatacyjnych, karty kontrolne, optymalizacja pracy oczyszczalni ścieków, błędy urządzeń pomiarowych WYKORZYSTANIE KART KONTROLNYCH DO WYSZUKIWANIA BŁĘDÓW POMIAROWYCH Współczesne oczyszczalnie ścieków wyposażone są w dużą liczbę aparatury pomiarowej, rejestrującej olbrzymią ilość danych. W takiej sytuacji ręczna kontrola poprawności wskazań każdego z urządzeń jest niemożliwa. Z drugiej jednak strony brak wykrycia błędów pomiarowych skutkować może stratami finansowymi i błędami eksploatacyjnymi. Karty kontrolne są jednym z podstawowych narzędzi tzw. Statystycznej Kontroli Procesu. Służą one do monitorowania procesu i wykrywania zakłóceń przy wykorzystaniu narzędzi statystycznych. W artykule przedstawiono wykorzystanie kart kontrolnych do wyszukiwania błędów urządzeń pomiarowych i analiz laboratoryjnych na podstawie przykładowego zbioru danych. 1. WSTĘP Stopień skomplikowania współczesnych układów oczyszczania ścieków jest bardzo wysoki. Zapewnienie stałej produkcji ścieków oczyszczonych o odpowiednich parametrach wymaga ciągłej sprawności wielu urządzeń kontrolno-pomiarowych. W przypadku większej oczyszczalni ścieków, liczba zainstalowanych czujników pomiarowych jest tak duża, że bezpośrednia kontrola ich wskazań (np. za pomocą wzorców) jest praktycznie niemożliwa. Dodatkowo niektóre mierniki (np. przepływomierze powietrza) służą do pomiaru parametrów, dla których wzorce nie istnieją. Kontrola wskazań takich urządzeń wymaga ich demontażu. W takiej sytuacji pomocne może być wykorzystanie gotowych narzędzi statystycznych dostępnych w ramach tzw. Statystycznej Kontroli Procesu (SKP). Głównym celem SKP jest bieżące zarządzanie jakością monitorowanego procesu za pomocą odpowiednich narzędzi staty- * Politechnika Wrocławska, Wydział Inżynierii Środowiska, Instytut Inżynierii Ochrony Środowiska, pl. Grunwaldzki 9, 50-377 Wrocław.
216 K. JANIAK i in. stycznych. Dostępne w ramach tej dziedziny narzędzia umożliwiają również analizę archiwalnych danych pomiarowych pod kątem wyszukiwania nieprawidłowości, takich jak niestandardowe warunki przebiegu procesu czy błędy pomiarowe. W artykule zaprezentowano dwa narzędzi SKP karty kontrolne T 2 Hotteling a oraz karty kontrolne Q (SPE). Karty kontrolne T 2 Hotteling a są graficzną reprezentacją wyników testu statystycznego T 2 Hotteling a, którego cechy pozwalają na zastosowanie tego testu do wyszukiwania zmian w przebiegu procesu, dzięki wrażliwości na jednoczesną nietypową zmianę wskazań większej ilości urządzeń pomiarowych. Karty kontrolne Q (SPE) są graficzną reprezentacją wyników testu statystycznego Q (SPE), którego cechy pozwalają na wykorzystanie go do wyszukiwania błędów pomiarowych urządzeń, ponieważ jest on wrażliwy na odchyłki w danych z pojedynczych urządzeń pomiarowych. 2. METODYKA STATYSTYCZNA 2.1. ANALIZA GŁÓWNYCH SKŁADOWYCH Wykorzystanie kart kontrolnych T 2 Hotteling a oraz kart kontrolnych Q (SPE) wymaga wstępnego przekształcenia analizowanego zbioru danych pomiarowych za pomocą analizy głównych składowych. Analiza głównych składowych (primary component analysis - PCA) jest bardzo popularną metodą, często wykorzystywana do redukcji ilości danych, wykrywania błędów oraz monitorowania przebiegu procesu [1]. Metoda ta pozwala uchwycić zależności pomiędzy poszczególnymi skorelowanymi zmiennymi oryginalnymi i transformować te zmienne w nowe, nie skorelowane ze sobą (tzw. składowe). Całkowita liczba składowych jest równa liczbie zmiennych oryginalnych, zwykle jednak w dalszych analizach uwzględnia się tylko te składowe, które opisują zmienność danych w stopniu większym niż zmienne oryginalne (czyli jedna składowa reprezentuje więcej niż jedną zmienną oryginalną). Jako, że składowe skonstruowane są w oparciu o zależności statystyczne pomiędzy oryginalnymi zmiennymi, wszelkie nieprawidłowości w danych są w stworzonym modelu PCA wyraźniejsze i łatwiejsze do uchwycenia, szczególnie gdy ilość zmiennych jest duża. Ta własność jest wykorzystywana do kontroli jakości danych. Analizę głównych składowych można przeprowadzić na dowolnym zbiorze danych. Najlepsze efekty uzyskuje się jednak w przypadku modeli, w których uzyskane składowe mają sens rzeczywisty, tzn. każda wyjaśnia zmienność parametrów oryginalnych, które są ze sobą rzeczywiście powiązane (np. jedna składowa wyjaśniająca zmienność jednocześnie stężenia BZT 5 oraz ChZT).
Wykorzystanie kart kontrolnych do wyszukiwania błędów pomiarowych 217 2.2. KARTY KONTROLNE Karty kontrolne są narzędziem służącym do wizualnej prezentacji i oceny jakości danych. W artykule omówiono dwa rodzaje kart: 1. karta kontrolna T 2 Hotteling a, 2. karta kontrolna Q (SPE). Karta kontrolna T 2 Hotteling a oparta jest na teście statystycznym T 2 Hotteling a. Test ten służy do wykrywania nieprawidłowości objawiających się nietypowymi wartościami wielu składowych. Pozwala on więc wykrywać zmiany przebiegu procesu [2], ponieważ pociągają one za sobą zwykle zmianę więcej niż jednego parametru czy grupy parametrów (np. zmiana wieku osadu pociąga za sobą zmianę natężeń przepływu osadu nadmiernego, przepływu powietrza oraz czasami parametrów ścieków oczyszczonych). Obliczona dla każdej obserwacji wartość statystyki T 2 Hotteling a, jest następnie porównywana z odpowiednio obliczoną wartością graniczną [3]. Przekroczenie wartości granicznej zwykle oznacza wyraźną zmianę warunków lub przebiegu procesu. Z kolei test Q (SPE) jest skonstruowany tak, aby być wrażliwym na odchyłki w wartościach pojedynczych składowych i dzięki temu jest on wrażliwy na błędy pomiarowe pojedynczych urządzeń [2].Odchyłka już w wartościach pojedynczej zmiennej jest wystarczająca, aby przekroczona została wartość graniczna. Karty kontrolne są graficzną interpretacją wyników tych testów. 3. ANALIZA DANYCH 3.1. PARAMETRY PODDANE ANALIZIE W tabeli 1. pokazano wykaz analizowanych parametrów. W pracy wykorzystano dane z okresu marzec 2008-marzec 2010 zgromadzone na Wrocławskiej Oczyszczalni Ścieków (WOŚ). Pomiary natężenia przepływu powietrza dokonywane były za pomocą 12 przepływomierzy, po trzy sztuki dla każdej komory tlenowej. Ładunki zanieczyszczeń obliczone zostały na podstawie wyników analiz laboratoryjnych oraz wskazań przepływomierza ścieków oczyszczonych. Analizowany zbiór składał się z 159 dób pomiarowych i 1272 rekordów. Zbiór poddano analizie głównych składowych. Jedynie dwie pierwsze składowe objaśniały zmienność zbioru danych w stopniu większym niż każda ze zmiennych oryginalnych, żadna z nich jednak nie była powiązana z ładunkiem N og usuwanym w części biologicznej oczyszczalni, dodatkowo wyjaśniały one jedynie 60% ogólnej zmienności danych.
218 K. JANIAK i in. Tabela 1. Analizowane parametry Parametr Całkowite natężenie przepływu powietrza, wszystkie komory komora 1 komora 2 komora 3 komora 4 Ładunek ChZT usuwany w części biologicznej oczyszczalni Ładunek N og usuwany w części biologicznej oczyszczalni Ładunek N-NO 3 odprowadzany z oczyszczalni Jednostka kg O 2 /m 3 kg N/m 3 kg N/m 3 Podjęto więc decyzję o uwzględnieniu w dalszych analizach trzeciej składowej, która powiązana była z ładunkiem N og usuwanym w części biol. oczyszczalni, ale nie została uwzględniona ze względu na zbyt mały udział w wyjaśnianej zmienności. Pozwoliło to również podnieść wyjaśnianą ogólną zmienność danych do 72%.Współczynniki korelacji pomiędzy składowymi, a zmiennymi oryginalnymi pokazano w tabeli 2. (najistotniejsze korelacje zaznaczono pogrubioną czcionką). Pierwsza składowa jest silnie skorelowana ze wszystkimi zmiennymi oryginalnymi opisującymi natężenia przepływu powietrza. Druga składowa jest silnie skorelowana z ładunkiem ChZT usuwanym w części biol. oczyszczalni oraz ładunkiem N-NO 3 odprowadzanym w ściekach ocz. Trzecia składowa jest silnie skorelowana z ładunkiem N og usuwanym w części biol. oczyszczalni. 3.2. KARTA KONTROLNA T 2 HOTTELING A Na rysunku 1. pokazano kartę kontrolną T 2 Hotteling a całego zbioru analizowanych danych. Na karcie zaznaczono granicę kontrolną. Doby pomiarowe dla której wartość statystyki T 2 Hotteling a przekracza granice kontrolną są to doby, w których zaszła istotna zmiana w przebiegu procesu. W omawianym przypadku sytuacja taka ma miejsce tylko w 22. dobie pomiarowej. W dobie tej w procesach zachodzących w blokach biologicznych usunięto bardzo duży ładunek ChZT (dwukrotnie większy niż średnia) oraz bardzo mały ładunek azotu ogólnego (dwukrotnie mniejszy niż średnia). Wysoka wartość statystyki T 2 Hotteling a jest związania z występowaniem anormalnych wartości w dwóch parametrach co sugeruje zmianę w procesie np. dopływ ścieków o nietypowym składzie.
Wykorzystanie kart kontrolnych do wyszukiwania błędów pomiarowych 219 Tabela 2. Współczynniki korelacji pomiędzy składowymi a zmiennymi oryginalnymi Parametr Składowa 1 Składowa 2 Składowa 3 Całkowite natężenie przepływu powietrza, wszystkie komory 0,99 0,00-0,07 komora 1 0,81 0,03 0,10 komora 2 0,73-0,27-0,1 komora 3 0,87 0,14-0,14 komora 4 0,63 0,06-0,19 Ładunek ChZT usuwany w części biologicznej oczyszczalni 0,26 0,74-0,02 Ładunek N og usuwany w części biologicznej oczyszczalni 0,26 0,01 0,94 Ładunek N-NO 3 odprowadzany z oczyszczalni -0,24 0,73 0,04 Rys. 1. Karta kontrolna T2 Hotteling a reprezentująca analizowane dane
220 K. JANIAK i in. 3.3. KARTA KONTROLNA Q (SPE) Na rysunku 2. pokazano kartę kontrolną Q (SPE). Na karcie zaznaczono granicę kontrolną. Doby pomiarowe dla której wartość statystyki Q przekracza granice kontrolną są to doby, w których wystąpił prawdopodobnie błąd pomiarowy. W omawianym przykładzie sytuacja taka ma miejsce w jednym przypadku (47. doba pomiarowa). Usunięty ładunek ChZT jest bardzo duży (ponad 2,5 krotnie większy od średniej), natomiast usunięty ładunek N og oraz natężenie przepływu powietrza nie odbiegają od średniej. Sugeruje to błąd pomiarowy parametrów wykorzystanych do obliczenia ładunku usuniętego ChZT. Rys. 2. Karta kontrolna Q (SPE) reprezentująca analizowane dane 4. PODSUMOWANIE Zaprezentowana metodyka pozwala na względnie szybkie wyszukanie błędów pomiarowych i zmian w przebiegu procesu. Jest ona szczególnie przydatna w przypadku dużych zbiorów danych i wielowymiarowych zależności pomiędzy poszczególnymi zmiennymi, gdzie klasyczne metody okazują się niewydajne.
Wykorzystanie kart kontrolnych do wyszukiwania błędów pomiarowych 221 Publikacja współfinansowana ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego LITERATURA [1] BHAVIK R., BAKSH I., Multiscale PCA with application to multivariate statistical process monitoring, AIChE Journal, 1998,Vol. 44, No.7,1596 1610. [2] DOYMAZ F., ROAGNOLI J.A., PALAZOGLU A., A strategy for detection and isolation of sensor failures and process upsets, Chemometrics and Intelligents Laboratory Systems, 2001, Vol. 55, 109 123. [3] MACGREGOR J.F., KOURTI T., Statistical process control of multivariate processes, Control Eng. Practice, 1995,Vol. 3 No.3, 403 414. CONTROL CHARTS AS A TOOL OF MEASUREMENT ERRORS SEARCH Modern wastewater treatment plants are equipped with large number of sensors, recording huge amount of data. Manual fault detection is therefore impossible. On the other hand, lack of control can cause financial losses and exploitation mistakes. Control charts are basic tools of Statistical Process Control. They are used for process monitoring and fault detections by means of statistics. In this paper control charts are used to find measurement errors in exemplary data.