Wykrywanie oraz eliminacja obserwacji odstających w hydrotechnice Detection and elimination of outliers in hydrotechnics dr inż. Stanisław Lach (1) (1) AGH Akademia Górniczo-Hutnicza w Krakowie, Wydział Geodezji Górniczej i Inżynierii Środowiska, Katedra Kształtowania i Ochrony Środowiska Stanisław Lach: slach@agh.edu.pl Słowa Kluczowe: błędy grube, zapory ziemne, bezpieczeństwo Streszczenie: Budowle hydrotechniczne ze względu na swoje rozmiary i masę należą do największych oraz najcięższych obiektów inżynierskich. Zapewnienie bezpieczeństwa eksploatacji budowli hydrotechnicznych wymaga stałego monitoringu. Podstawową formą monitoringu obiektów hydrotechnicznych są m.in. wielokrotne, okresowe pomiary piezometryczne, które są jednym z obowiązkowych elementów pomiarów kontrolnych, mających zapewnić bezpieczeństwo użytkowania obiektu, co bezpośrednio wiąże się z zapewnieniem bezpieczeństwa pracowników zatrudnionych na obiekcie oraz ludzi mieszkających i pracujących na terenie narażonym na zniszczenie w razie katastrofy obiektu. Podczas obserwacji poziomu zwierciadła wody w piezometrze otwartym lub ciśnienia wody w piezometrze zamkniętym mogą pojawić się różnego rodzaju czynniki, które mogą być przyczyną zaburzenia tych pomiarów. Przyjmują one charakter systematyczny, przypadkowy lub oczywistej pomyłki. Przed przystąpieniem do analizy takich danych należy odrzucić błędy grube, mogące znacząco wpłynąć na jej wynik, jak również spowodować fałszywą ocenę lub interpretację badanego zjawiska. W takiej sytuacji konieczne jest zastosowanie pewnych testów statystycznych, dzięki którym możliwe będzie przyjęcie bądź odrzucenie pomiaru wątpliwego na przyjętym poziomie istotności α. W niniejszej pracy wykorzystano trzy testy statystyczne służące do identyfikacji oraz odrzucenia obserwacji odstających: dwa warianty testu Q-Dixona (test oznaczony symbolem N9 oraz N13), test Grubbsa oraz test Hampela. Zakres pracy obejmuje analizę pomiarów piezometrycznych dla zapory Tresna z lat 2009-2013. 1. Wstęp Zapewnienie bezpieczeństwa eksploatacji budowli piętrzących takich jak zapory wymaga stałego monitoringu (Naprawy i modernizacja 2002). Podstawową formą monitoringu zapór ziemnych są m.in. wielokrotne, okresowe pomiary piezometryczne, dzięki którym możliwa jest kontrola filtracji przez budowlę piętrzącą, a tym samym ocena zachowania się konstrukcji (Opyrchał i in. 2013). Przed przystąpieniem do analizy danych piezometrycznych należy odrzucić obserwacje odstające, które w sposób znaczący mogą wpłynąć na jej wynik oraz spowodować fałszywą ocenę lub interpretację zjawiska poddawanego analizie (Opyrchał i Lach 2014). Postępowanie z wynikami pomiarów uznanymi za wątpliwe jest jednym z najbardziej kłopotliwych problemów, na które można natrafić podczas wykonywania jakiejkolwiek
analizy danych. Wyniki takie są skutkiem jednorazowego wpływu ważnej, zakłócającej przyczyny, która działa w sposób przejściowy i tylko przy niektórych pomiarach. Pojedynczy wynik pomiarowy obarczony takim rodzajem błędu jest najczęściej wielkością skrajną (minimalną lub maksymalną) rosnąco uporządkowanego zbioru wyników. W przypadku serii pomiarowej, która obejmuje wyniki pomiarów dokonywanych w warunkach powtarzalności błąd taki jest łatwy do wykrycia oraz identyfikacji. Oznacza to, iż niezależne wyniki badań tych samych jednostek są uzyskiwane przy użyciu tej samej metody, przez tego samego obserwatora i tym samym sprzętem, w takich samych warunkach oraz stosunkowo krótkich odstępach czasu (PN-ISO 5725-1:2002P, PN-ISO 5725-2:2002P, Traple i Twardowski 2006, PN-ISO 3534-1:2009P). Błędy grube mogą wystąpić m.in. podczas wykonywania pomiarów, w trakcie rejestracji wyników, przy wprowadzaniu ich do baz danych oraz mieć swoje źródło przykładowo w błędnym odczycie skali przyrządu pomiarowego i pomyłki przy przesuwaniu przecinka podczas zapisu wyniku lub podczas zamiany jednostek. Na Rys. 1 przedstawiono wzajemne relacje pomiędzy możliwymi odmianami błędów pomiarowych: błędem przypadkowym, błędem systematycznym (dodatnim i ujemnym) oraz błędem grubym. Rys.1. Zobrazowanie występujących rodzajów błędów pomiarowych (Opracowanie własne) Pojęcie błędu, występujące w pomiarze naukowym, ściśle łączy się z niemożliwą do całkowitego uniknięcia niepewnością, która w sposób nierozerwalny związana jest z istotą wykonywania pomiaru przy wykorzystaniu danej metody. W tym sensie błędy nie charakteryzują pomyłek, których można uniknąć w przypadku większej staranności podczas wykonywania pomiarów. Należy więc dążyć do minimalizacji rozmiarów błędów oraz znalezienia sposobu na oszacowanie ich wielkości [Konieczka i in. 2014]. W przypadku okresowych pomiarów poziomu zwierciadła wody w piezometrze otwartym lub ciśnienia wody w piezometrze zamkniętym, obserwacje są rejestrowane jednorazowo dla każdego z piezometrów. Nie posiadamy więc próbki zawierającej po kilka wyników tej samej obserwacji dla tego samego piezometru, a dysponujemy jedynie pomiarami niezależnymi. W związku z tym, ewentualne zakłócenia w przebiegu zmian poziomu wody w piezometrach możemy zauważyć, porównując je z obrazem pochodzącym z poprzednich okresów pomiarowych. Jeżeli pomiar oraz obliczenia wykonywane są przez jednego obserwatora, który kontroluje i ma na uwadze warunki wykonania pomiaru, jak również ewentualnie występujące zakłócenia, możliwe jest odrzucenie odstającej obserwacji. W przypadku pomiarów piezometrycznych pożądane oraz celowe byłoby jego powtórzenie. Z reguły jednak osoba, która wykonuje obliczenia i analizy otrzymuje jedynie same wyniki pomiarów, bez dodatkowych informacji dotyczących ich przebiegu. W takiej sytuacji konieczne jest zastosowanie pewnych testów statystycznych, dzięki którym możliwe będzie przyjęcie lub odrzucenie pomiaru wątpliwego na przyjętym poziomie istotności α (Lach 2014).
2. Materiał i metody Zbiornik Tresna zlokalizowany jest na terenie województwa śląskiego. Powstał on w wyniku przegrodzenia zaporą ziemno-narzutową rzeki Soła w 40+025 km w miejscowości Tresna. Powierzchnia zbiornika przy maksymalnym poziomie piętrzenia wynosi 9,64 km 2, natomiast jego całkowita pojemność osiąga wartość 96,11.106 m 3 (Kaskada rzeki Soły 2007). W Tab. 1 ukazano podstawowe parametry zbiornika Tresna. Spiętrzenie wody w zbiorniku wykorzystywane jest w elektrowni wodnej zlokalizowanej na lewym brzegu Soły. Jest to budowla wolnostojąca, częściowo wcinająca się w dolny taras nasypu zapory, niezwiązana z jej konstrukcją. Elektrownia szczytowa i interwencyjna w Tresnej posiada moc równą 21 MW i produkuje średnio 28,40 GWh energii elektrycznej rocznie. Zbiornik Tresna podniósł walory turystyczno-wypoczynkowe regionu, jak również stworzył dogodne warunki do budowy ośrodków wypoczynkowych w atrakcyjnym podgórskim terenie (Kaskada rzeki Soły 2007). Zapora ziemno-narzutowa w Tresnej zamyka zlewnię o powierzchni 1030 km 2 piętrząc wodę do rzędnej 342,70 m n.p.m. Podstawowe parametry zapory przedstawiono w Tab. 2. Tab.1. Podstawowe parametry zbiornika Tresna (Kaskada rzeki Soły 2007) Parametr Wartość Normalny poziom piętrzenia 342,70 m n.p.m. Maksymalny poziom piętrzenia 345,00 m n.p.m. Pojemność całkowita 96,11. 10 6 m 3 Pojemność powodziowa letnia 39,45. 10 6 m 3 Pojemność powodziowa zimowa 31,07. 10 6 m 3 Pojemność wyrównawcza zimowa 61,85. 10 6 m 3 Pojemność wyrównawcza letnia 53,47. 10 6 m 3 Długość zbiornika 7 km Powierzchnia zbiornika 9,64 km 2 Tab.2. Podstawowe parametry zapory w Tresnej (Kaskada rzeki Soły 2007) Parametr Wartość ZAPORA Rzędna korony 348,00 m n.p.m. Szerokość korony 10,0 m Nachylenie skarpy odwodnej 1:2 Nachylenie skarpy odpowietrznej: od korony do rzędnej 331,00 pomiędzy rzędną 331,00 a stopą zapory Wysokość zapory Długość korony UPUST DENNY Światło upustu trzy przewody o przekrojach Długość łączna (od początku murków wichrowatych na wlocie do końca wypadu) 1:1,75 1:2 39,0 m 310 m 4,0 x 4,0 m 176,70 m Łączny, maksymalny wydatek upustu 628,0 m 3. s -1 Zamknięcia przewodu Zasuwy płaskie ślizgowe z napędem
Jaz wlotowy (3-przęsłowy): Rzędne: korony jazu przęseł skrajnych korony jazu przęsła środkowego klapy hydraulicznym. PRZELEW POWIERZCHNIOWY Z BYSTRZEM Dwa skrajne przęsła konstrukcja betowa ciężka typu Creagera o świetle 23,0 m każde, Środkowe zamykane klapą typu Fischbauch o świetle 15,0 m. Jaz wlotowy podzielony na przęsła dwoma filarami (szerokość 2,3 m, długość 16,4 m, wysokość 8,4 m). 342,70 m n.p.m. 341,00 m n.p.m. 345,00 m n.p.m. Łączny, maksymalny wydatek przelewu 830,0 m 3. s -1 Odkształcenia i przemieszczenia zapory w Tresnej kontrolowane są przez 111 reperów, w tym: na korpusie zapory 15 szt., na upuście dennym 18 szt., na przelewie powierzchniowym: na lewej stronie 21 szt., na prawej stronie 27 szt., na moście nad przelewem 9 szt., na wlocie do sztolni 4 szt., na elektrowni wodnej 9 szt., na murze oporowym 8 szt. Obecnie zapora posiada 25 piezometrów otwartych oraz 16 piezometrów zamkniętych służących do obserwacji stanów wody w jej korpusie. Szkic rozmieszczenia piezometrów na przekrojach pomiarowych zapory w Tresnej ukazano na Rys. 2. Ponadto zapora wyposażona jest w szczelinomierze zlokalizowane w galerii kontrolno-zastrzykowej oraz w szczelnie między blokiem oporowym a wieżą zamknięć. Rys.2. Rozmieszczenie piezometrów na przekrojach pomiarowych zapory w Tresnej (Materiały udostępnione przez RZWG w Krakowie) Dla zapory Tresna zlokalizowanej w województwie śląskim analizie poddano pomiary zmian zwierciadła wody w piezometrach otwartych (łącznie 25 piezometrów) oraz zamkniętych (łącznie 16 piezometrów) obejmujące okres 5 lat (od 2009 do 2013 roku). Dane piezometryczne udostępnione zostały przez Regionalny Zarząd Gospodarki Wodnej w Krakowie. Dla tej zapory dla każdego piezometru badania przeprowadzono dla 120 pomiarów odczytywanych średnio dwukrotnie w ciągu miesiąca. W przypadku piezometrów
zamkniętych nie dysponowano rzędnymi stopek manometrów, stąd wartości ciśnień zostały przeliczone jedynie na wysokości słupa wody o ciężarze właściwym γ=9.807 kn m -3 (Opyrchał 2010). W niniejszej pracy wykorzystano trzy testy statystyczne służące do identyfikacji oraz odrzucenia obserwacji odstających: dwa warianty testu Q-Dixona (test oznaczony symbolem N9 oraz N13), test Grubbsa oraz test Hampela (Grubbs 1969, Verma i Quiroz-Ruiz 2006, Taylor 2013). Dixon (1950, 1951, 1953) zaproponował sześć różnych wariantów testu statystycznego służącego do wykrywania wyniku obarczonego błędem grubym. Za pracą Barnetta i Lewisa (1994) w literaturze przedmiotu testy te są zwyczajowo oznaczane symbolami N7 oraz N9-N13. W niniejszej pracy skoncentrowano się na dwóch wariantach: testach oznaczonych symbolami N9 (weryfikacja hipotezy o pojedynczej obserwacji odstającej) oraz N13 (weryfikacja hipotezy o parze największych lub najmniejszych obserwacji odstających). Test Q-Dixona jest wykorzystywany w celu sprawdzenia, czy w danym zbiorze danych nie występuje wynik obarczony błędem grubym. Warunkiem koniecznym dla stosowania opisywanego testu jest liczność zbioru obserwacji z przedziału 3-100. Za pomocą testu Q-Dixona można każdorazowo odrzucić z analizowanego zbioru danych tylko pojedynczy odstający wynik lub parę wyników odstających. W niektórych opracowaniach można odnaleźć warianty testu Q-Dixona dla serii pomiarowych składających się od 3 do 30 lub nawet 100 obserwacji (Verma i Quiroz-Ruiz 2006, Konieczka i in. 2014). Przed wykonaniem testu Grubbsa zbiór wyników eksperymentalnych (próbkę statystyczną) należy uszeregować w ciąg niemalejący. Błędem grubym może być obarczona największa (x max) lub najmniejsza (x min) wartość wyniku w analizowanej próbce. Test ten jednorazowo, podobnie jak w przypadku testu Q-Dixona daje możliwość wykrycia tylko jednej wartości odstającej, dlatego należy go powtarzać do momentu, gdy w zbiorze danych nie zaobserwuje się kolejnych wartości odstających od pozostałych wyników (Grubbs 1969, Konieczka i in. 2014). Test Hampela jest wykorzystywany w celu wykrycia w analizowanym zbiorze danych wyników znacznie odbiegających od wartości przeciętnych. Dużą i niewątpliwą zaletą testu jest łatwość jego przeprowadzenia, gdyż nie występuje tutaj ograniczenie dotyczące liczebności badanego zbioru. Wnioskowanie na temat charakteru badanej obserwacji następuje w oparciu o ocenę uzyskanych wyników analizy na podstawie określonych formuł. W związku z tym nie ma konieczności odczytywania wartości krytycznej statystyki testowej ze specjalnych tablic (Davies 1988). Na Rys. 3, Rys. 4 oraz Rys. 5 w sposób schematyczny zobrazowano algorytmy przeprowadzania wymienionych testów statystycznych, które mają na celu identyfikację oraz odrzucenie obserwacji określanych mianem błędów grubych. Tradycyjne wnioskowanie w teście Grubbsa prowadzi się przy uwzględnieniu tylko jednego poziomu istotności (np. α=0,05). Schemat wnioskowania zaprezentowany na Rys. 4 uwzględnia dodatkowo sytuacje, w których wartość statystyki testowej jest zbliżona do granic zbioru krytycznego, co może powodować trudności z jednoznaczną interpretacją wyniku testu (Konieczka i in. 2014).
Rys.3. Algorytm postępowania podczas przeprowadzania testu Q-Dixona (Opracowanie własne) Rys.4. Algorytm postępowania podczas przeprowadzania testu Grubbsa (Opracowanie własne)
3. Wyniki Rys.5. Algorytm postępowania podczas przeprowadzania testu Hampela (Opracowanie własne) Uzyskane wyniki zestawiono w Tab. 3 oraz Tab. 4. Tab.3. Zestawienie liczby wyników odstających dla statystycznych testów Q-Dixona, Grubbsa i Hampela dla zapory Tresna dla piezometrów otwartych (Opracowanie własne) Oznaczenie piezometru otwartego Liczba wykrytych obserwacji odstających dla statystycznych testów: Q-Dixona Grubbsa Hampela wariant N9 wariant N13 Po5 2 4 3 1 Po31 1 4 3 0 Po6 2 4 2 0 Po9 0 0 0 0 Po11 1 2 2 0 Po18 0 0 0 0 Po22 0 0 0 1 Po30 1 2 1 0 Po19 0 0 0 1 Po23 0 0 0 0
Po24 1 2 1 0 Po29 1 2 1 0 Po4 0 2 2 0 Po8 1 2 1 1 Po10 1 2 1 0 Po12 1 2 1 0 Po20 0 0 0 0 Po28 0 0 0 0 Po21 0 0 0 0 Po27 2 4 2 1 Po13 0 0 0 0 Po15 0 0 0 0 Po17 0 0 0 0 Po25 0 0 0 0 Po26 0 0 0 0 Tab.4. Zestawienie liczby wyników odstających dla statystycznych testów Q-Dixona, Grubbsa i Hampela dla zapory Tresna dla piezometrów zamkniętych (Opracowanie własne) Oznaczenie piezometru zamkniętego Liczba wykrytych obserwacji odstających dla statystycznych testów: Q-Dixona Grubbsa Hampela wariant N9 wariant N13 Pc1 1 4 0 25 Pc2 0 0 0 25 Pc3 0 0 0 5 Pc4 0 0 0 9 Pc4a 1 2 1 4 Pc5 0 2 0 11 Pc6 1 4 1 2 Pc7 2 4 1 7 Pc8 1 4 0 0 Pc9 0 2 2 3 Pc10 1 2 3 2 Pc11a 1 2 1 1 Pc12 0 0 0 10 Pc13 2 2 2 28 Pc14 1 2 1 27 Duża liczba wykrytych obserwacji odstających dla statystycznego testu Hampela związana jest z konstrukcją tego testu. W przypadku, gdy w zbiorze danych występuje duża liczba obserwacji o tych samych wartościach podczas obliczenia wartości odchyleń r i od wartości mediany uzyskujemy wynik równy 0. Następnie wartość mediany ze zbioru odchyleń również uzyskujemy równą 0, więc w przypadku, gdy moduł odchyleń r i przyjmuje wartość większą od 0 to obserwacja jest traktowana jako odstająca.
4. Dyskusja i wnioski Dla zapory Tresna w latach 2009-2013 w przypadku piezometrów otwartych testy statystyczne wykazały istnienie 18 obserwacji odstających (0,60% wszystkich wyników), natomiast dla piezometrów zamkniętych 13 obserwacji odstających (0,68%). Przed przystąpieniem do analizy danych piezometrycznych należy odrzucić błędy grube, które nawet w przypadku jednej obserwacji odstającej mogą znacząco wpłynąć na jej wynik oraz spowodować fałszywą ocenę lub interpretację badanego zjawiska. Pojedynczy wynik pomiarowy obarczony błędem grubym jest najczęściej wielkością skrajną (minimalną lub maksymalną) uporządkowanego zbioru wyników. Błędy grube, które mogą pojawić się podczas różnego rodzaju pomiarów (także w przypadku pomiarów piezometrycznych), powodowane są przez wiele czynników. Do najistotniejszych przyczyn powstawania błędów tego rodzaju zaliczyć można: pomyłki przy wykonywaniu odczytu lub zapisu wskazań instrumentów najczęściej popełniane błędy przez obserwatora (np. niepoprawna numeracja punktów lub przypadkowa zamiana kolejności dwu sąsiednich liczb), uszkodzenia sprzętu pomiarowego, wykorzystanie sprzętu pomiarowego w niewłaściwy sposób, specyfika pomiaru, która związana jest z doborem odpowiedniej metody, zmiana warunków pomiarowych (np. niesprzyjające warunki pogodowe, oblodzenie itp.), nieodpowiedni sposób pomiaru (pobrania danych), przechowywania lub ich przygotowania do analizy, mechaniczne uszkodzenia punktów pomiarowych, wprowadzenie danych pomiarowych do bazy danych w niewłaściwy sposób. 5. Literatura Barnett V, Lewis T (1994) Outliers in Statistical Data. Wiley, New Jersey. Davies PL (1988) Statistical evaluation of interlaboratory tests. Fresenius' Zeitschrift für analytische Chemie Vol. 331(5): 513 519. Dixon WJ (1950) Analysis of extreme values. The Annals of Mathematical Statistics Vol. 21(4): 488 506. Dixon WJ (1951) Ratios involving extreme values. The Annals of Mathematical Statistics Vol. 22(1): 68 78. Dixon WJ (1953) Processing data for outliers. Biometrics Vol. 9(11): 74 89. Grubbs FE (1969) Procedures for detecting outlying observations in Samples. Technometrics Vol. 11(1): 1 21. Kaskada rzeki Soły. Zbiorniki Tresna, Porąbka, Czaniec (2007) Monografie budowli hydrotechnicznych w Polsce. Instytut Meteorologii i Gospodarki Wodnej, Warszawa. Konieczka P, Namieśnik J, Zygmunt B (2014) Ocena i kontrola jakości wyników pomiarów analitycznych. Wydawnictwo Naukowo-Techniczne, Warszawa. Lach S (2014) Rozprawa doktorska: Zmodyfikowana metoda iloczynu skalarnego służąca do badania kierunku filtracji w zaporach ziemnych. Akademia Górniczo-Hutnicza im. Stanisława Staszica, Wydział Geodezji Górniczej i Inżynierii Środowiska, Katedra Kształtowania i Ochrony Środowiska, Kraków. Materiały udostępnione przez RZWG w Krakowie. Naprawy i modernizacja zapór oraz budowli towarzyszących. Przegląd metod i przykłady. Rozdział 3 Zapory betonowe i murowane (2002). Biuletyn 119 ICOLD/CIGB. Instytut Meteorologii i Gospodarki Wodnej, Warszawa. Opyrchał L (2010) Wstęp do mechaniki cieczy w inżynierii środowiska. Wydawnictwa Akademii Górniczo-Hutniczej im. Stanisława Staszica w Krakowie, Kraków. Opyrchał L, Lach S, Łągiewka M (2013) Analiza zmiany trendu poziomu zwierciadła wody w zaporze ziemnej w Pieczyskach. Zapory bezpieczeństwo i kierunki rozwoju. Monografie Instytutu Meteorologii i Gospodarki Wodnej: 142 152.
Opyrchał L, Lach S (2014) Badanie kierunku filtracji w zaporach ziemnych z wykorzystaniem metody iloczynu skalarnego. Zagrożenia jakości wód powierzchniowych i metody działań ochronnych. Wydawnictwo Katolickiego Uniwersytetu Lubelskiego: 289 300. PN-ISO 3534-1. 2009. Statystyka Słownik i symbole Część 1: Ogólne terminy statystyczne i terminy wykorzystywane w rachunku prawdopodobieństwa. Polski Komitet Normalizacyjny, Warszawa. PN-ISO 5725-1. 2002. Dokładność (poprawność i precyzja) metod pomiarowych i wyników pomiarów Część 1: Ogólne zasady i definicje. Polski Komitet Normalizacyjny, Warszawa. PN-ISO 5725-2. 2002. Dokładność (poprawność i precyzja) metod pomiarowych i wyników pomiarów Część 2: Podstawowa metoda określania powtarzalności i odtwarzalności standardowej metody pomiarowej. Polski Komitet Normalizacyjny, Warszawa. Taylor JR (2013) Wstęp do analizy błędu pomiarowego. Tłumaczenie Adam Babiński i Rafał Bożek. Wydawnictwo Naukowe PWN, Warszawa. Traple J, Twardowski K (2006) Uwagi do wątpliwych wyników pomiarów. Wiertnictwo, Nafta, Gaz Vol. 23(2): 699 714. Verma SP, Quiroz-Ruiz A (2006) Critical values for six Dixon tests for outliers in normal samples up to sizes 100, and applications in science and engineering. Revista Mexicana de Ciencias Geológicas Vol. 23(2): 133 161.