WARSZTATY z cyklu Zagrożenia naturalne w górnictwie Mat. Symp. str. 33 44 Jerzy KORNOWSKI Główny Instytut Górnictwa, Katowice Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego pokładu węgla Streszczenie Praca ta stanowi część drugą dwuczęściowego cyklu dotyczącego prognozy sejsmoakustycznej (cześć pierwszą stanowi artykuł: Kurzeja (), dalej oznaczany krótko jako Cz. ) i przedstawia wyniki obszernych badań, w których korzystając z dużego zbioru jakościowo dobrych obserwacji z ZG Piekary porównano wyniki prognozowania (godzinowej logarytmicznej energii łącznej tzn. AE i wstrząsów) za pomocą różnych wariantów algorytmu prognozy liniowej. Algorytm ten wybrano wśród wielu możliwych ze względu na jego prostotę i dobrze rozwinięte podstawy teoretyczne. Stwierdzono, że nie wszystkie warianty metody są jednakowo dobre i że najlepsze z nich zapewniają na badanym zbiorze obserwacji skuteczność prognozy zbliżoną do 54% co oznacza że wariancja błędu prognozy wynosi około 46% wariancji obserwacji a wartość średnia błędu prognozy jest (na badanym zbiorze obserwacji) bardzo bliska zeru.. Wprowadzenie i przegląd problemów prognozy Prognoza zagrożenia sejsmicznego jest centralnym problemem sejsmoakustyki (AE) i sejsmologii górniczej. Przedmiotem prognozy może być albo czas, miejsce i energia przyszłego wstrząsu (taka prognoza jest marzeniem użytkowników, jest jednak bardzo trudna i na razie nieosiągalna), albo też zmienna w czasie i okresowo (co ΔT, np. co godzinę) liczona wartość zagrożenia definiowana (np. Kornowski ; patrz także Cz. ) jako prawdopodobieństwo, że łączna energia emisji (AE i wstrząsów) w nadchodzącej jednostce czasu ΔT, zawarta będzie w przedziale (E, E) energii dopuszczając E. W praktyce celowe jest ustalenie, dla wyrobiska w konkretnych warunkach, dolnej granicy E niebezpiecznej energii wstrząsu (np. Konopko 994; tabl. 8, także Dubiński i Konopko, str. 79) i definiowanie zagrożenia jako prawdopodobieństwa, że E (t, t + T) > E, wymagając równocześnie by okres T (obserwacji /interpretacji/prognozy) był znacznie krótszy od średniego czasu między niebezpiecznymi wstrząsami. Ponieważ energia łączna większa jest od energii samych wstrząsów a energia AE w ciągu T rzadko sięga wartości niebezpiecznych (np. 4 J), możliwe jest ustalenie ( alarmowego ) progu E na użytecznym i bezpiecznym poziomie. Prognoza nie tylko w geofizyce jest możliwa gdy dysponujemy zbiorem informacyjnym It danych/obserwacji związanych z przyszłymi wartościami prognozowanej wielkości Zt+τ (np. zagrożenia) oraz algorytmem/metodą/teorią (F) umożliwiającą wnioskowanie o Zt+τ na podstawie It. Gdy teoria ta ma postać matematyczną, nazywamy ją modelem prognozy (także modelem lub filtrem predykcyjnym). Wartość zmiennej x, wyprognozowaną algorytmem F na podstawie zbioru informacyjnego 33
J. KORNOWSKI Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... I t oznaczamy ~ x (I t, F) lub krócej x~ t rozumiejąc przez to, że x~ t (t, t+ T) = F(It). Fundamentem prognozy jest empirycznie i logicznie uzasadnione przekonanie, że im lepszy zbiór It i model F, tym bliżej teoretycznego optimum będą wyniki prognozy. Zastrzeżenie, iż wyniki prognozy zbliżać się mogą tylko do pewnego optimum, a nie do (bardzo pożądanej lecz zwykle nieosiągalnej) wartości prawdziwej (czyli przyszłej obserwacji) jest bardzo ważne, bo np. w przypadku szumu białego N (, s ) żaden, nawet idealny zbiór I t i model F nie dadzą prognoz o wariancji mniejszej od s (która może przecież być bardzo duża i odległa od oczekiwań/potrzeb praktyki!). Cała teoria i praktyka prognozy sprowadzają się do poszukiwania jak najlepszego modelu F oraz zbioru It. By najważniejsze problemy i warunki racjonalnej prognozy postawić jasno i potem do nich nie wracać, stwierdzić trzeba że: zajmujemy się tu prognozą, której zbiór informacyjny It składa się z minionych wartości log-energii łącznej Et = log(ewstrz + EAE + )t, obserwowanych w kolejnych przedziałach czasu T [E t jest skrótem symbolu E(t, t+ T)]. Taką prognozę nazywamy sejsmoakustyczną prognozą zagrożenia sejsmciznego (SPZS); inna zawartość It może być przyczyną innej nazwy metody/prognozy. Zauważmy, że zbiór I t z którego korzysta SPZS, jest bardzo ubogi i nie zawiera żadnych informacji geologicznych czy górniczych. Zagadnienie rozszerzenia bazy informacyjnej należy do podstawowych problemów prognozy zagrożenia sejsmicznego, w zagadnieniu SPZS nie występuje problem czasu (prognoza jest formułowana co T i dotyczy nadchodzącego T) ani miejsca (prognoza dotyczy ściany objętej obserwacją AE). A oto niektóre warunki konieczne SPZS: a) Konieczna jest lokalizacja wstrząsów tak, by zbiór I t nie został zaśmiecony wprowadzającymi w błąd zdarzeniami obcymi. b) Energie AE i wstrząsów muszą być addytywne (liczyć trzeba fizyczną, wyrażoną w dżulach J, energię AE, odrzucając tzw. energię umowną ). c) E wstrz i E AE zaobserwowane w minionym przedziale T muszą być równocześnie, co T, dostępne programowi który liczy E t (zatem tworzy zbiór I t) i prognozuje. d) Et (zatem Ewstrz oraz EAE) muszą być liczone z dokładnością zapewniającą użyteczność wyników. Dokładność prognoz energii nie będzie lepsza od dokładności obserwacji/estymacji energii (zdarzeń minionych) a grube błędy w It wywołają jeszcze większe błędy prognozy. e) Im krótsze są okresy T obserwacji i prognozy, tym większe są szanse zaobserwowania emisji poprzedzającej nagłą zmianę zagrożenia (być może wstrząs). Częstość obserwacji/interpretacji/prognozy winna zależeć od stanu zagrożenia. Okresy zmianowe ( T = 8 godzin) są reliktem epoki przedkomputerowej i powinny być radykalnie skrócone. f) Istnieć musi co najmniej pośredni związek między obserwowanymi (i wchodzącymi do I t) parametrami emisji AE a wstrząsami które decydują o zagrożeniu; związek ten Kornowski () nazwał postulatem jedności emisji uznając, że wspólną przyczyną AE i wstrząsów (o nieodległych źródłach) jest pole naprężeń (modyfikowane eksploatacją i niejednorodnościami). Postulat ten (w teorii) dopuszcza wnioskowanie o zagrożeniu {tzn. Z = F(I t)} w obszarze S tylko na podstawie zdarzeń z S i mających wspólną z zagrożeniem przyczynę. Oznacza to m.in. konieczność eliminowania hałasów i zakłóceń oraz konieczność teoretycznie poprawnego traktowania emisji związanej ze skrawaniem (zagadnienie to opisują tzw. sejsmoakustyczne równania stanu skrawanej ściany (Kornowski ) lecz wykracza to poza zakres niniejszej pracy). 34
WARSZTATY z cyklu Zagrożenia naturalne w górnictwie Określić jeszcze należy formę wyników prognozy i miarę jakości. W każdej chwili t, przyszła wartość energii łącznej E(t, t+ t) jest wielkością nieznaną, która traktowana być musi jako zmienna losowa opisana swym (ewoluującym) rozkładem prawdopodobieństwa (jeśli E(t, t- t) została już zaobserwowana, to jest wielkością znaną i deterministyczną: proces (z założenia: dokładnej) obserwacji przekształca wielkość nieznaną w znaną, a losową w deterministyczną). Kornowski () sugeruje, że błąd optymalnej prognozy E t łącznej log-energii może być dobrze aproksymowany jako N(, s ): Zatem z każdą jednostką czasu T, prognozować należy wartość E ~ t i jej wariancję s, a dla użytkownika najwygodniejsze jest korzystanie z α % przedziału ufności i prawdopodobieństwa przekroczenia wartości niebezpiecznej, E (prawdopodobieństwo to nazywamy zagrożeniem!). Prognoza w chwili t winna zatem mieć postać zdania: z prawdopodobieństwem 9%, E α < E ~ (t, t+ T) < E β, a prawdopodobieństwo że E(t, t+ t) > E wynosi Z" (przy czym E α, E β, Z to konkretne, liczone co T wartości, E ustala Dział Tąpań kopalni dla danego wyrobiska (np. korzystając z Tab. 5.4, Dubiński i Konopko ), a wartość 9% jest tylko przykładem (może być 95%)). Dział Tąpań kopalni winien wiedzieć jak informację tę w praktyce wykorzystać, a przepisy/instrukcje winny to ułatwiać. Ponieważ wartość średnia błędów optymalnej prognozy jest zerem, dobrą miarą jakości prognozy jest iloraz: gdzie: S to wariancja błędu prognozy b obs S to wariancja obserwacji. VARNOR = 35 obs S b /S (.) W terminologii regresji liniowej, VARNOR = R gdzie R to współczynnik determinacji. Jest to ocena statystyczna, wymagająca wielu prób/prognoz i wykluczająca osądzanie wyników (także modelu i zbioru It) na podstawie pojedynczych (lub nielicznych) przypadków. Wśród dostępnych nam wyników obserwacji z kopalń, dane ze ściany 33/5 Zakładu Górniczego Piekary najbliższe były spełnienia warunków SPZS, toteż te właśnie obserwacje wykorzystano. Oznacza to jednak, że zakres ważności przedstawianych wyników ograniczony jest do warunków słabego lub co najwyżej średniego zagrożenia tąpaniami. Przedmiotem tej pracy są wyniki badań porównawczych zdolności predykcyjnej (mierzonej wartością VARNOR) i użyteczności praktycznej (uwzględniającej też prostotę/złożoność metody) szeregu wariantów znanej metody prognozy liniowe za pomocą przybliżonych filtrów Wienera. Algorytmy opisane były (m.in.) w Cz., tu podane są wyniki prognozy i niektóre informacje szczegółowe.. Wyniki prognozy liniowej.. Opis zadania i przykładowe wyniki Prognozą liniową nazywamy obliczanie, w każdej dyskretnej chwili t (t = i T, i =,,...) wartości: x t+ = a x t + a x t- +... + a Lx t-l+ (.)
J. KORNOWSKI Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... gdzie: a wektor parametrów (a,...,a L) nazywamy (liniowym) predyktorem (także filtrem predykcyjnym) rzędu L. Na przykład x t mogą to być wartości log-energii łącznej w kolejnych jednostkach T (np. w kolejnych godzinach) i wówczas równanie (.) realizuje sejsmoakustyczną prognozę zagrożenia sejsmicznego (SPZS) wykorzystując zbiór I t = (x,..., x t) i model (.). Prognozę liniową nazywamy optymalną gdy wartości (a,...,a L oraz L) dobrane są w sposób gwarantujący minimalizację średniokwadratowego błędu prognozy a w praktyce ponieważ właściwie dobrany filtr (.) jest tak zwanym estymatorem nieobciążonym czyli gwarantującym że średni błąd prognozy jest zerem gdy zapewniona jest minimalizacja wariancji (VARNOR) błędu prognozy. Istnieje obszerna literatura dotycząca optymalizacji parametrów filtru predykcyjnego (Robinson i Treitel 98; Box i Jenkins 97; Burg 975), zagadnienie to opisano także w Cz., tutaj więc przypomnieć wystarczy że warunkiem użyteczności metody (prognozy liniowej) jest występowanie (dla przesunięcia τ > ) istotnie różnej od zera autokorelacji r(τ) w szeregu czasowym (x t) obserwowanych i prognozowanych wielkości. Brak istotnej autokorelacji wyklucza użyteczność prognozy liniowej. Zagadnienie autokorelacji w szeregach czasowych emitowanej energii (AE, wstrząsów i łącznej) dyskutowane było i ilustrowane przykładami w pracach Kornowskiego i Kurzeji (), Kornowskiego (), a także w Cz. gdzie stwierdzono, że autokorelacja taka występuje w stopniu uzasadniającym stosowanie prognozy liniowej. Zauważyć też trzeba że (przed przystąpieniem do prognozy) niewiadomymi są zarówno parametry filtru predykcyjnego (a,...,a L) jaki jego rząd L, i wyznaczyć trzeba zarówno L jak i parametry; ponadto nowoczesne algorytmy estymujące optymalne wartości parametrów filtru, obliczają też (zakładając stacjonarność procesu np. emisji energii łącznej) przybliżoną wariancję błędu prognozy. Ponieważ błąd prognozy logarytmicznej energii łącznie ma rozkład w przybliżeniu normalny (z wartością średnią ), znajomość wariancji wystarcza do określenia przedziałów ufności. Przykład prognozy dla 9 tygodni obserwacji energii łącznej z ść 33/5 ZG Piekary i jej wyników pokazano na rysunku.. i.. Na rysunku.. widzimy trzy pary wykresów a każda para dotyczy trzytygodniowego okresu obserwacji i składa się z: wykresu górnego, przedstawiającego (przebieg środkowy) obserwowane wartości godzinowej log-energii łącznej wewnątrz (wykresy powyżej i poniżej) 9% przedziału ufności dla prognozy, wykresu dolnego przedstawiającego błędy prognozy. Można zauważyć, że energia obserwowana czasami lecz niezbyt często wykracza poza granice 9% przedziału ufności co jest zrozumiałe (można, oczywiście, wyznaczyć przedziały bardziej pewne, np. 95% lub 99%, lecz nie wydaje się to celowe). Na rysunku.. pokazano z lewej dla obserwowanych wartości log-energii łącznej, z prawej dla błędów prognozy od góry: autokorelację, histogram częstości występowania (czyli przybliżony rozkład gęstości prawdopodobieństwa) danej wartości oraz widmo szeregu czasowego (obserwowanej godzinowej log-energii lub błędu prognozy tej energii). Zauważyć należy, że w autokorelacji obserwacji bardzo wyraźna jest składowa okresowa o okresie 68 godzin ( tydzień), wymuszona rytmem produkcji, a w widmie widoczne są też składowe o okresie T = i T = 4 godziny; ponadto histogram obserwacji jest zdecydowanie odległy od (zaznaczonego na jego tle) rozkładu normalnego o tej samej średniej i wariancji. Pokazana z prawej strony rysunku.. autokorelacja błędów predykcji nie różni się w sposób istotny od szumu białego [r(τ) <,96/ 53 nie jest więc istotna], choć w widmie znaleźć można jeszcze oznaki składowych i 4-godzinnych. Histogram błędów predykcji znacznie 36
WARSZTATY z cyklu Zagrożenia naturalne w górnictwie bardziej przypomina rozkład normalny (choć w sensie ścisłym nie jest nim) o wartości średniej,6 (a więc bliskiej zera) i wariancji σ =,9... Prognoza modelem autoregresji rzędu L 5 Metoda prognozy liniowej dostosowana jest do przetwarzania wsadowego i dla ustalonego zbioru (x k, x k+,..., x k+n-) obserwacji o liczebności N, określa parametry (L opt; a i, i=,..., L opt; s ) filtru predykcyjnego. Ponieważ jednak poszukiwanie optymalnego rzędu (optymalnej długości) filtru, L opt, odbywa się porównując jakość coraz to dłuższych filtrów (L =,,..., L max), zadana musi zostać pewna wartość maksymalna, L max, by program nie liczył w nieskończoność. Od wyboru tej wartości (L max) również zależeć może ostateczna jakość prognozy. Ponieważ w przypadku obserwacji godzinowych dane napływają sekwencyjnie (co godzinę), oprócz wartości L max określić trzeba szerokość (N) okna czasowego na którym, dla zadanej wartości L max, algorytm estymuje (L opt; a i, i=,...l opt; s ) a także określić trzeba krok (KROK) tego okna, gdyż (choć prognoza robiona jest co godzinę) filtr obliczać można (np.) co godzinę, albo co dobę, albo co tydzień, albo w ogóle tylko raz (na początku, gdy uruchamiany jest algorytm). Ponadto, przed każdym obliczeniem filtru (L opt, a i, s ) ze zbioru (x k, x k+,..., x k+n-) można usuwać wartość średnią x (k, k+n) lub można jej nie usuwać. Istnieje więc ogromna liczba możliwych przypadków i wariantów, a próba wyboru optymalnego sposobu prognozy (tylko metodą prognozy liniowej i tylko na jednym, 9-tygodniowym zbiorze obserwacji z ść 33/5 ZG Piekary) wymaga bardzo obszernego eksperymentu numerycznego. Wyniki tego eksperymentu, zawsze określone wartością VARNOR, znormalizowanego błędu prognozy, przedstawiono w tabeli.. 5 loge/h 4 3 48 96 44 9 4 88 336 384 43 48 loge/h - 48 96 44 9 4 88 336 384 43 48 5 loge/h 4 3 54 55 6 648 696 744 79 84 888 936 984 loge/h - 54 55 6 648 696 744 79 84 888 936 984 5 loge/h 4 3 8 56 4 5 48 96 344 39 44 488 loge/h - 8 56 4 5 48 96 344 39 44 488 t[h] t[h] t[h] t[h] t[h] t[h] Rys... Wyniki prognozy dziewięciotygodniowej (5 godz.) obserwacji godzinowej logarytmicznej energii łącznej (AE + wstrząsów) ze ść 33/5 ZG Piekary (zagrożenie słabe do średniego). W wierszach, 3, 5 energia obserwowana wraz z 9% przedziałem ufności dla prognozy (zauważ sporadyczne wykroczenia obserwacji poza granice 9% przedziału ufności). W wierszach, 4, 6 błędy prognozy godzinowej log-energii łącznej. Obserwacje rozpoczęto w poniedziałek, godz. 6 Fig... Results of nine-weeks prediction of AE and mining tremors energy 37
J. KORNOWSKI Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... g(x) 5 3 4 r( ).5 x =,9 =,4 5 x = loge/h g(x) 5 r( ).5 x =,6 =,9 - x = loge/h (h) -.5 3 4 db - (h) -.5 3 4 db - -4-6 T[h] T[h] T(h) 48 4 6-4 -6 T[h] T(h) 48 4 6 Rys... Statystyczne charakterystyki obserwacji (z lewej) i błędów prognozy (z prawej) pokazanych na rysunku.. Od góry: histogram danych na tle rozkładu normalnego o tej samej średniej i wariancji (zauważ wartości x oraz σ ), w środku: funkcja autokorelacji obliczona na podstawie 5 wartości danych (w r(τ) obserwacji zauważ składową okresową o okresie tygodniowym), u dołu: widmo szeregu czasowego godzinowych obserwacji błędów prognozy Fig... The statistic characteristics of observation and prediction errors showed on Fig... Użyty do estymacji parametrów a i algorytm pochodził z pracy Kalouptsidisa i innych (985) i został zmodyfikowany przez autora między innymi poprzez wprowadzenie kryterium FPE (patrz Cz. ) do wyznaczania optymalnej długości filtru L opt. W tabeli.. uwzględniono tylko skrajne wartości ( oraz ) parametru KROK, i dla KROK = parametry (L opt, a i, i=,... L opt) estymowano co godzinę, a dla KROK = parametry te estymowano tylko raz, na początku przetwarzania ciągu obserwacji. Dla innych wartości tego parametru (KROK) otrzymuje się wyniki pośrednie, zrezygnowano więc z ich przedstawiania. Szerokość okna, N, określono w godzinach (68 godzin to tydzień). Symbol x t oznacza estymację parametrów bez usuwania wartości średniej ze zbioru obserwacji, symbol x t- x oznacza, że ze zbioru (x K,..., x K+N-) przed estymacją filtra (L opt, a i, s ) usunięto średnią: x (k, N) = N - (x k + x K+ +...+ x K+N-) (.) Wartość VARMOR =,47 oznacza że prognoza usuwa 53% wariancji z ciągu obserwacji, VARNOR = oznacza prognozę idealnie dokładną a VARNOR = oznacza, że prognozowano wartość średnią ciągu obserwacji. Pamiętając, że wyniki uzyskano na zbiorze 53 obserwacji godzinowych z ZG Piekary są to więc wyniki wiarygodne w warunkach umiarkowanego stanu zagrożenia tąpaniami, zawarte w tabeli.. wyniki podsumować można następującymi wnioskami: W. Zastosowana metoda i wykorzystany zbiór obserwacji, w obszarze dopuszczonych długości filtru, umożliwiają prognozę ze średnią jakością. Błędy prognozy mają wartość 38
WARSZTATY z cyklu Zagrożenia naturalne w górnictwie średnią (nie ilustrowaną w tabeli.., lecz widoczną na histogramie, rysunek.. z prawej) w przybliżeniu równą zero i wariancję, w najlepszym przypadku, wynoszącą około 47% wariancji ciągu obserwacji. W. Usuwanie średniej poprawia jakość prognoz systematycznie lecz bardzo nieznacznie (VARNOR maleje nie więcej jak o %). Tabela.. Wartości VARNOR znormalizowanej wariancji błędu prognozy liniowej w zależności od szerokości okna (N) i dopuszczalnej długości Lmax filtru, dla parametrów KROK = i KROK oraz dla przypadków usuwania i nie usuwania średniej x ze zbioru przed estymacją parametrów filtru. Wyniki uzyskano dla 53 godzinowych obserwacji (9 tygodni) log-energii łącznej ze ść 33/5 ZG Piekary Table.. Values VARNOR of normalised variance of linear prediction error L max x N [godz.] KROK 68 336 54 67 84 3 x t 493 495 484 487 484 48 48 48 48 48 x t - x 49 493 48 48 476 474 474 474 469 474 4 x t 493 495 48 484 48 478 478 476 476 476 x t x 493 493 478 48 476 47 47 469 467 469 5 x t 493 495 48 484 48 478 478 476 476 473 x t x 493 493 478 48 476 47 469 469 469 469 x t 497 56 489 5 487 487 478 493 476 493 x t x 497 56 487 5 48 48 469 487 467 489 5 x t 5 55 49 55 487 495 48 54 48 56 x t x 5 55 487 53 48 49 474 5 469 5 x t 5 55 49 55 49 495 48 54 48 56 x t x 5 55 487 53 48 49 474 5 469 5 min (5, N/) x t 55 6 495 55 487 495 484 54 48 56 x t x 53 6 4 53 478 49 474 5 47 5 Uwaga: podane wartości należy podzielić przez W3. Wzrost długości okna (N) poprawia jakość prognozy, lecz niezbyt systematycznie i w niewielkim stopniu (wzrost wartości N od 68 do 84 powoduje spadek VARNOR o 4%). Sugeruje to stacjonarność procesu emisji. 39
J. KORNOWSKI Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... W4. Wpływ kroku okna (KROK) niewielki i niesystematyczny dla filtrów krótkich, staje się wyraźny dla L max, gdzie widać, że jakość prognozy pogarsza się ze wzrostem długości kroku, co jest nieuniknione w przypadku lokalnych nie stacjonarności emisji. W praktyce kopalnianej, krok o umiarkowanej długości np. tygodniowy, tzn. KROK = 68, co oznacza aktualizację parametrów raz w tygodniu powinien okazać się rozwiązaniem racjonalnym. W5. Filtry krótkie, np. ograniczone wartością L max = 5, zapewniają prognozę lepszą od filtrów długich. Wynik ten jest bardzo ważny, gdyż decyduje o prostocie i efektywności obliczeń (wynik ten, choć z pozoru zaskakujący bo filtry krótkie są podzbiorem filtrów długich jest znany w teorii prognozy liniowej), równocześnie ograniczając obszar dalszych badań..3. Prognoza modelem jednoparametrowym uwzględniającym okresowość Ewidentna obecność (w obserwowanych wartościach łącznej godzinowej log-energii, patrz rys...) składowej okresowej o okresie tygodniowym bez wątpienia wymuszona procesem produkcji skłoniła autora (we współpracy z Autorką Cz. ) do próby wykorzystania modelu: x(t) = αx(t ) + ( α) x (t 68) (.3) gdzie: α. W modelu tym występuje tylko jeden parametr (α) którego optymalną (minimalizującą błąd dopasowania w oknie czasowym o szerokości N) wartość znajduje się przy pomocy algorytmu tzw. złotego podziału. Zwracam jednak uwagę, że podane dalej wartości VARNOR określają znormalizowaną wariancję błędu predykcji, a nie dopasowania. Dla α = otrzymuje się model: x(t) = x( t ) (.4a) Optymalny dla procesu przyrostów niezależnych (zwanego też ruchem Browna lub procesem błądzenia przypadkowego ang.: random walk). Model ten sugeruje, że jak było w minionej godzinie, tak będzie w następnej i jest bardzo popularny w wielu zastosowaniach, także w sejsmoakustyce, gdzie obowiązująca Instrukcja (implicite) utożsamia prognozę (na okres t+) z oceną zagrożenia (w okresie t). W przypadku α = otrzymuje się model optymalny dla procesu okresowego o okresie tygodniowym, zaburzonego białym szumem: x(t) = x(t 68) (.4b) Postać autokorelacji obserwacji (rys...) sugeruje, że i ten model powinien być brany pod uwagę. Postać ogólna modelu jednoparametrowego (.3) dopuszcza jak się wydaje dowolną mieszaninę tych procesów uznano więc, że stanowić może model warty zbadania. Jak poprzednio, możliwa jest wielka liczba wariantów algorytmu prognozy ze względu na długość okna czasowego (N) i jego krok (KROK). {badano także dodatkowo celowość zastąpienia członu x(t 68) w równaniach (.3) i (.4b), członem K - [x(t 68) + x (t 68) +... + x (t K 68)] dla różnych wartości K nie otrzymując jednak wyników lepszych od otrzymanych dla K =, stąd ograniczamy się do K = }. Otrzymane wyniki przedstawiono w tabeli.., określającej znormalizowany błąd prognozy VARNOR dla optymalnych wartości parametru α zależnie od wartości parametrów N oraz KROK. 4
WARSZTATY z cyklu Zagrożenia naturalne w górnictwie Tabela.. Wartości VARNOR, znormalizowanej wariancji błędu prognozy optymalnym filtrem jednoparametrowym (4) w zależności od szerokości okna (N) i od kroku okna (KROK) Table.. Values VARNOR of normalised variance of prediction error of one-parameter filter N KROK 4 68 68 5 5 53 57 336 54 55 57 53 54 54 56 53 543 67 56 57 53 544 84 58 59 53 547 Uwaga: podane wartości należy podzielić przez. Badano ponadto wartości VARNOR dla α = (czyli zakładając błądzenie przypadkowe ) oraz dla α = (czyli zakładając proces okresowy na tle białego szumu) w obu przypadkach otrzymując systematycznie wartości znacznie większe od pokazanych w tabeli.. (dla α = typowo VARNOR,59, dla α = typowo VARNOR > ), co upoważnia do ważnego wniosku: W6. Proces (szereg czasowy) utworzony z godzinowych wartości łącznej log-energii (obserwowanej w ścianie 33/5 ZG Piekary) nie może być aproksymowany ani modelem przyrostów niezależnych (który zwany jest też ruchem Browna lub błądzeniem przypadkowym) ani, tym bardziej, modelem procesu okresowego na tle szumu białego. Ponadto, porównanie wartości VARNOR w tabela.. i w tabeli.. upoważnia do wniosku. W7. Prognoza modelem jednoparametrowym (4) uwzględniającym okresowość daje wyniki w sposób istotny gorsze od wyników standardowej prognozy liniowej. Zauważmy na koniec, że model (4) może być traktowany jako szczególny przypadek predyktora liniowego, krótkiego lecz bardzo wysokiego rzędu (L = 68) z narzuconymi bardzo silnymi ograniczeniami (a i =, i =, 3,..., 67; a = a 68)..4. Jeszcze trzy modele liniowe Celem pełniejszego wyjaśnienia i zrozumienia możliwości prognozy krótkimi optymalnymi filtrami predykcyjnymi, pojęto badanie filtrów: M : x(t) = a x (t-) (.5a) M : x(t) = b x (t-) + b x (t-) (.5b) 3 M 68 : x(t) = q x (t-) + q x (t-) + q 3x (t-68) (.5c) na tym samym zbiorze danych z ZG Piekary. Wyniki prognozy podano poniżej w tabeli.3. i.4. 4
J. KORNOWSKI Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... Ponieważ optymalne wartości parametrów filtrów znajduje się rozwiązując tzw. równania normalne prognozy (patrz Cz. ) zwykle wykorzystując przy tym wartości autokorelacji, r(τ), zbioru obserwacji, powstaje dodatkowo cały szereg możliwości obliczeniowych (wariantów metody) można bowiem autokorelację liczyć usuwając uprzednio wartość średnią ze zbioru obserwacji lub jej nie usuwając, ponadto w każdym przypadku stosować można tzw. obciążony: lub nieobciążony: N τ r o(τ) = N - τ r n(τ) = (N-τ) - x(t)x(t τ) (.6a) N τ τ x(t)x(t τ) (.6b) estymator autokorelacji. Wyniki podane w tabeli.3. dotyczą wyłącznie przypadku prognozy wykorzystującej (do obliczenia optymalnych parametrów filtru a lub b i b ) obciążony estymator r o(τ) obliczany po usunięciu wartości średniej ze zbioru (dotychczasowych) obserwacji. Przyczyna tego wyjaśniona będzie poniżej. Tabela.3. Wartość VARNOR oraz wartości średnie ε błędu predykcji dla 53 godzinowych obserwacji logenergii łącznej w przypadku prognozy optymalnym filtrem pierwszego (M) i drugiego (M) rzędu Table.3. Values VARNOR and average prediction error for 53 hours observation log-energy KROK 4 68 N M M M M M M M M M 336 VARNOR 53 469 56 469 58 47 57 463 ε,,,3,,4,3,,6 54 VARNOR 5 467 5 467 53 467 57 463 ε,3,,3,,4,3,9,4 67 VARNOR 53 468 54 467 55 467 55 463 ε,4,3,4,3,5,4,7,3 84 VARNOR 5 467 54 467 54 467 55 463 ε,5,3,5,3,6,4,6,3 Uwaga: wartości VARNOR podzielić należy przez Z tabeli.. wynikają kolejne, istotne wnioski: W8: Model M umożliwia usunięcie około 49% wariancji a model M około 53% wariancji ze zbioru obserwacji. Nawet najlepsze z wyników podanych w tabeli.. nie są istotnie lepsze od uzyskanych modelem M. W9: Średni błąd kwadratowy jest sumą wariancji i kwadratu błędu średniego. Uwzględnienie kwadratu błędu średniego (który jest bliski zera zawsze prócz przypadku KROK = ) wyjaśnia pozornie bardzo dobre działanie filtrów, które są raz tylko (na początku procesu prognozy) estymowane a potem stosowane bez zmiany: w rzeczywistości filtry te nie gwarantują zerowej średniej wartości błędu predykcji i parametr VARNOR nie jest dla 4
WARSZTATY z cyklu Zagrożenia naturalne w górnictwie nich właściwą miarą jakości (lepszą miarą jest średni błąd kwadratowy). 3 Ostatnia seria obliczeń związana była z optymalizacją i zastosowaniem filtru M 68 określonego równaniem (6c). Jest to filtr wprawdzie krótki (trzyelementowy) lecz tak wysokiego rzędu (L = 68) że stosowanie standardowych metod estymacji uznano za niecelowe. Równocześnie filtr ten umożliwia uwzględnienie składowej okresowej o okresie tygodniowym, a porównanie uzyskanych wyników z wynikami uzyskanymi przy użyciu M umożliwia ocenę informacji zawartej w składowej okresowej. Wyniki przedstawione w tabeli.4. dotyczą tylko przypadku wykorzystania obciążonego estymatora autokorelacji (7a ). Wyniki uzyskane stosując estymator nieobciążony były systematycznie gorsze ich przedstawianie uznano więc za niecelowe. Analiza tabeli.4. i porównanie z tabeli.3. skłania do następujących wniosków. M umożliwia w najlepszym przypadku (N = 54, KROK = 68) prognozę z błędem W: 3 68 VARNOR,46 ( =,3, VARNOR +,46) o około,5% mniejszym niż za pomocą filtru M. Jest to zaskakująco mała poprawa jakości prognozy, być może warta głębszej analizy. W: Jak poprzednio, usuwanie średniej (ze zbioru obserwacji) i wykorzystanie obciążonego estymatora autokorelacji poprawia wyniki w stopniu niewielkim lecz systematycznie, winno więc być zawsze stosowane. Prognoza filtrem którego współczynniki są tylko raz liczone, prowadzi do wyników gorszych od uzyskanych filtrem okresowo aktualizowanym. Wyniki podane w tabeli.4. sugerują też, że racjonalne jest aktualizowanie filtru raz w tygodniu i stosowanie okna N = 54. Tabela.4. Wartości VARNOR (wariancji znormalizowanej błędu prognozy) oraz średniego błędu prognozy filtrem M 3 68 dla różnych wartości kroku (krok) okna i szerokości (N) okna, gdy z obserwacji usuwano (x x ) wartość średnią i gdy jej nie usuwano (xt) Values VARNOR and average prediction error of M 3 68 filter KROK 4 68 43 Table.4. N x t x - x x t x - x x t x - x x t x - x 336 VARNOR 49 464 495 465 493 464 484 453 ε......3.. 54 VARNOR 489 46 49 46 489 46 48 453 ε......3.. 67 VARNOR 486 46 488 46 486 46 477 456 ε..3..3..4..9 84 VARNOR 484 46 485 46 484 46 476 459 ε..3..3..4..9 Uwaga: wartości VARNOR należy podzielić przez 3. Wnioski. Na obszernym zbiorze obserwacji z ZG Piekary wykazano, że możliwa jest prognoza liniowa godzinowych wartości logarytmicznej energii łącznej (AE i wstrząsów) ze
J. KORNOWSKI Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... sprawnością (czyli jakością, mierzoną parametrem VARNOR = -R określającym redukcję wariancji wskutek prognozy) lepszą od 5%. Wartość liczbowa VARNOR zależy od zbioru obserwacji może więc być traktowana tylko jako przykład.. Optymalną prognozę liniową umożliwiają filtry bardzo krótkie, 5 elementowe, zatem łatwe do obliczenia i stosowania. 3. Uzyskane wyniki wskazują, że estymację parametrów filtru predykcyjnego można i warto powtarzać raz w tygodniu (a potem przez tydzień stosować obliczone wartości parametrów): zapewnia to wystarczającą adaptacyjność (zdolność dostosowania się do zmiennych warunków) metody. 4. Jeżeli do estymacji filtru wykorzystywana jest autokorelacja, stosować należy estymator obciążony, r o(τ), zawsze najpierw usuwając wartość średnią. 5. Cała procedura estymacji filtru predykcyjnego i prognozy tym filtrem jest tak prosta że jeśli obsługa Stacji Geofizycznej zapewni dopływ (do komputera PC) godzinowych wartości fizycznej (wyrażonej w dżulach, J) energii AE i wstrząsów może działać całkowicie automatycznie, nie kolidując z obowiązującymi metodami (sejsmoakustyczną i sejsmologiczna) i dostarczając dodatkową informację o zagrożeniu która łatwo może być ilościowo sprawdzona. Literatura [] Box G. E. P., Jenkins G. M. 97: Time Series Analysis Forecasting and Control. San Francisco, Holden-Day. [] Burg J. P. 975: Maximum Entropy Spectral Analysis. Ph. D. Dissertation, Stanford Univ. [3] Dubiński J., Konopko W. : Tąpania: ocena, prognoza, zwalczanie. Katowice, GIG. [4] Kalouptsidis N., Carayannis G., Manolakis D., Koukoutsis D. 985: Efficient Recursive in Order Least Squares FIR filtering and Prediction. IEEE Trans. Acoust. Speech Sign. Processing, ASSP-33, 75 87. [5] Konopko W. 994: Doświadczalne podstawy kwalifikowania wyrobisk górniczych w kopalniach węgla kamiennego do stopni zagrożenia tąpaniami. Prace Naukowe GIG nr 795, Katowice. [6] Kornowski J. : Podstawy sejsmoakustycznej oceny i prognozy zagrożenia sejsmicznego w górnictwie. GIG, Katowice. [7] Kornowski J., Kurzeja J. : Korelacja energii wstrząsów górniczych z emisją sejsmoakustyczną i ocena możliwości jej wykorzystania w matematycznych modelach prognozy. Mat. XXIII Zim. Szk. Mechaniki Górotworu, Wyd. Katedra Geomech. Górn. i Geotech. AGH, Kraków, 8 95. [8] Kurzeja J. : Podstawy sejsmoakustycznej prognozy energii emitowanej z eksploatowanego pokładu węgla. Mat. Symp. Warsztaty. [9] Robinson E., Treitel S. 98: Geophysical Signal Analysis. Englewood Cliffs N. J., Prentice-Hall. The examples of seismoacoustic energy prediction emitted from exploited hand coal bed Results of experimental investigations have been presented, comparing performance (as measured by variance reduction factor) of many variants of the linear prediction method, when used to predict hourly observed energy of seismic and seismoacoustic (AE) emission from a longwall in Piekary Coal Mine. We conclude that not all the variants of the linear prediction behave equally well and that due to the best of them approximately 54% reduction of variance is possible for this set of observations. 44 Przekazano: 8 marca