CATS, program do analizy szeregów czasowych współrzędnych GPS ELŻBIETA BUREK Opiekun: dr hab. inż. Mariusz Figurski, prof. WAT Wojskowa Akademia Techniczna, Wydział Inżynierii Lądowej i Geodezji, 00-908 Warszawa, ul. Gen. S. Kaliskiego 2 Streszczenie. W pracy przedstawiono działanie programu CATS, który przeznaczony jest do badania i porównania procesów szumów stochastycznych w szeregach czasowych współrzędnych GPS. Przeprowadzono analizę szeregów czasowych współrzędnych stacji JOZE, należącej do sieci EUREF Permanent Network. Słowa kluczowe: analiza szumów, CATS, szeregi czasowe 1. Wstęp W największym uproszczeniu, sygnał to zmienność dowolnej wielkości fizycznej, która może zostać opisana za pomocą funkcji jednej f(x) lub wielu zmiennych f(x 1, x 2, x 3, ). Najbardziej interesujące sygnały są funkcją czasu f(t), więc sygnał jest to zmienność wielkości fizycznej w funkcji czasu. Każdy obiekt (biologiczny, społeczny, czy techniczny), w otaczającym nas świecie, generuje sygnały, które zawierają informację o tych obiektach. Najczęściej sygnał zawiera: sygnał użyteczny (niesie użyteczną informację) oraz sygnał nieużyteczny (szum, czyli każdy sygnał w układzie nie będący sygnałem użytecznym). Efektem istnienia sygnałów nieużytecznych (szumów) są zakłócenia. Precyzyjne pomiary geodezyjne, na stacjach permanentnych, zapewniają dane, któreoprócz sygnału użytecznego posiadająrównież zakłócenia. Zakłócenia te bezpośrednio oddziałują na określenie charakterystyk danej stacji oraz ich błędów standardowych. Wyodrębnienie szumów pozwoli na zwiększenie dokładności wyznaczenia współrzędnych oraz prędkości na stacjach referencyjnych.
2. Analiza szeregów czasowych Kształtowanie się zjawiska w kolejnych okresach czasu, pokazuje ciąg obserwacji, zwany szeregiem czasowym. Jedna z definicji mówi, że szereg czasowy to realizacja procesu stochastycznego, którego dziedziną jest czas, a pojedyncze obserwacje y t są realizacją zmiennych losowych Y t. Wśród składników szeregu czasowego można wyróżnić: - składniki systematyczne, takie jak trend (tendencja rozwojowa), stały poziom i składniki okresowe (czyli wahania cykliczne i okresowe), - składniki przypadkowe (szum). Szeregi czasowe analizowane są w celu odgadnięcia natury badanego zjawiska i znalezienie najlepiej opisującego go modelu oraz w celu prognozowania, czyli przewidywania kolejnych wartości szeregu, na podstawie znalezionego modelu. Rys.1. Szereg czasowy zmian współrzędnych dla składowej północnej ze stacji BOGO
3. Program CATS W niniejszej pracy prezentowany jest samodzielny program CATS (ang.create and Analyze Time Series), który został stworzony przez dr Simona Williamsa, pracownika NationalOceanography Centre w Liverpool. Program ten przeznaczony jest do badania i porównania szumów w szeregach czasowych współrzędnych GPS oraz do szacowania błędów wyliczonych parametrów. Oprogramowanie CATS rozwiązuje problem w dwóch etapach: - wpasowanie wieloparametrowego modelu do danych szeregów czasowych, wykorzystując metodę najmniejszych kwadratów; - równoczesna analiza reszt do wyznaczenia amplitudy modelu szumów. Pomierzona składowa współrzędnych stacjimoże zostać zamodelowana przez początkową wartość x 0 (odcięta punktu przecięcia z osią OX) i prędkość r (zakładając liniowe zmiany), tak, że: x(t j ) = x 0 + rt j + ε x (t). Założono, że błędy są kombinacją liniową ciągu nieskorelowanych zmiennych losowych (szumu białego) α i ciągu czasowo skorelowanych zmiennych (szumukolorowego) β, w postaci: ε(t) = aα(t) + b κ β(t), współczynniki a i b κ są wielkościami odpowiednio szumu białego i kolorowego. [1] Obecnie w programie CATS, do oszacowania składników szumurealizowane są trzy metody: metoda największej wiarygodności (MLE), szacowanie widmowe i szacowanie empiryczne. W wyniku wielu badań ustalono, że najdokładniejsze wyniki otrzymuje się przy wykorzystaniu metody MLE. 3.1. Metoda największej wiarygodności n Funkcja wiarygodności L(x; λ) = i=1 f(x i, λ) jest funkcją gęstości, w której w miejsce zmiennych losowych x i podstawia się wartości uzyskane w wyniku pobierania próby z rozkładu f(x, λ). Zakłada się, że postać matematyczna funkcji gęstości f jest znana, nie jest znana natomiast wartość parametru λ. W takiej sytuacji funkcja wiarygodności staje się funkcją tego parametru. Zgodnie z zasadą największej wiarygodności, za estymatę nieznanego parametru λ powinna być wybrana taka liczba λ, dla której funkcja wiarygodności osiąga maksimum:
L(x; λ ) = max Wymaganie maksymalnej wartości funkcji wiarygodnościsprowadza się do żądania znalezienia pierwiastka λ równania: λ L(x; λ) = 0, przy warunku 2 λ 2 L(x; λ) λ=λ < 0. Ponieważ funkcja L, jak i jej logarytm, osiąga maksimum dla tej samej wartości argumentu, estymaty największej wiarygodności poszukiwane są z bardziej praktycznego równania oraz dla ogólnego przypadku z k niewiadomymi parametrami (λ 1,, λ k ) = λnależy rozwiązać układ k równań: λ j ln L(x; λ) = n i=1 ln f(x λ i ; λ) = 0, dla j = 1, 2,, k j W algorytmach programu CATS parametry i składniki szumu szacowane są ze zmaksymalizowanej funkcji prawdopodobieństwa l dla danych obserwacji x. Przyjmując rozkład Gaussa, funkcja ma postać: l(x, C) = gdzie: det wyznacznik macierzy; 1 (2π) N/2 (det C) 1,2 exp( 0,5ν T C 1 ν ) C macierz kowariancji reprezentująca przyjęty model szumu w danych; N ilość epok; ν - reszty po dopasowywaniu do funkcji liniowej, używając metody najmniejszych kwadratów z tą samą macierzą kowariancji C. Funkcja prawdopodobieństwa jest logarytmowana: ln[l(x, C)] = 1 2 [ln(det C) + ν T C 1 ν + N ln 2π] Jeśli założymy, że zaobserwowany szereg czasowy X = {x j, t j (j = 1, N)} jest złożony tylko z szumu białego z wariancją σ w 2, szumu różowego z wariancją σ f 2 i błądzenia przypadkowego σ 2 rw, to macierz kowariancji obserwacji ma postać: Q xx = σ 2 w I + σ 2 f R f + σ 2 rw R rw gdzie Ijest N x N macierzą jednostkową oraz R f i R rw są macierzami reprezentującymi kowariancję odpowiednio szumu różowego i błądzenia przypadkowego. Wartości σ 2 w, σ 2 2 f iσ rw są oszacowane za pomocą maksymalizacji funkcji prawdopodobieństwa: L(X, σ 2 w, σ 2 f, σ 2 rw ) = (2π) N/2 Q xx 1/2 exp ( 1 XQ 2 xx 1 X) [2]
W celu poprawy szybkości obliczeniowejdokonano redukcjiszacowania amplitud do problemu jednowymiarowego.w rzeczywistości, wymagana macierz kowariancji może być jakąkolwiek kombinacją różnych modeli: m C = σ i 2 gdzie występuje m różnych macierzy kowariancji. Aby ustalić macierz J i, algorytm MLE rozwiązuje m wymiarowy problem. Jeśli macierz kowariancji zawiera jedno źródło szumu, wtedy: a logarytm prawdopodobieństwa ma postać: i=1 C = σ 2 J ln[l(x, σ)] = 1 2 [2N ln(σ) + ln(det J) + ν T J 1 ν σ 2 gdzie σ to amplituda szumu. J i + N ln(2π)] Następnie, resztyν znajdowane są przy użyciu metody najmniejszych kwadratów, a oszacowane parametry (bez ich niepewności) są niezmienne w stosunku do zmiany skali macierzy kowariancji. W przypadku dwóch źródeł szumu, zamiast dwóch amplitud szumu σ 1 i σ 2, można poddać je transformacji i otrzymać dwie alternatywne zmienne: kąt φ i skalar r, takie, że: σ 1 = r cos φ σ 2 = r sin φ. Dla danego kąta φ i dla r, można rozwiązać maksymalizację logarytmu prawdopodobieństwa jako funkcję kąta i przez to zredukować problem do jednego wymiaru. Prowadzi to do wykonania dużo mniej kroków algorytmu, niż równoważna maksymalizacja m wymiarowa. 3.2. Modele szumu Obecnie program CATS może utworzyć macierz kowariancji dla następujących modeli szumu: a) Szum z zależności potęgowej. Jest często odpowiednim modelem, wykorzystywanym do przybliżenia zjawisk geofizycznych, w dziedzinie częstotliwości, opisany jako: P(f) = P 0 ( f f 0 ) κ [2]
gdzie: f częstotliwość; κ- wykładnik widmowy; P 0,f 0 - znormalizowane stałe. Indeks κ zazwyczaj znajduje się w przedziale [-3 do 1], gdzie: dla -3 <κ< -1 to ułamkowe ruchy Browna; dla -1 <κ< 1 to ułamkowy biały szum. Szczególne przypadki występują dla całkowitych wartości indeksu: n = 0 Szumbiały, to ciąg niezależnych zmiennych losowych, o jednakowych rozkładach prawdopodobieństwa, ze skończonymi wartościami przeciętnymi i wariancjami. Jeśli są to rozkłady normalne, z wartością przeciętną zero, to mamy do czynienia z gaussowskim szumembiałym. Taki proces czysto losowy, ma wartości funkcji autokorelacji równe zeru dla każdego opóźnienia. Macierz kowariancji jest skalarem C x = a 2 I i T j κ/4 = 1, więc jest niezależna od czasu. n = -1 Szumróżowy, jest zwykle obserwowany w różnorodnych procesach dynamicznych, takich jak: zmienność plam słonecznych, wahania Ziemi wokół osi, prądy morskie i błędy w pomiarach czasu zegarami atomowymi. [3] Macierz kowariancji:c x = J 1 = [( 3 4 )2 (24I J 0 ) ] 12 NxN gdzie element (i, j) macierzy symetrycznej J 0 wynosi: 0; i = j J 0 = { log(j i) + 2; i < j log 2 n = -2 Błądzenie przypadkowe, to prosty proces stochastyczny, jego przykładem są tzw. ruchy Browna. Cząstka Browna wykonuje ruch losowy, analizowany jest ruch w jednym kierunku poziomym, który oznaczono jako oś X (zrzutowano ruch trójwymiarowy na jedną oś). Przedstawiając taki ruch na wykresie, oś pionowa przedstawia położenie cząstki, oś pozioma czas. Każde doświadczenie zaczyna się w chwili t = 0, w miejscu x = 0. Macierz kowariancji: C x (t) = J 2 (t) = f s 1 [ 1 1 1 1 1 2 2 2 1 2 3 3 1 2 3 N ], f s = N 1 T
gdzie: f s - jest częstotliwością próbkowania [yr -1 ]; T - cały zakres czasu obserwacji; N - liczba obserwacji. b) FOGM (ang. First order Gauss Markovnoise)[4] proces Gaussa-Markowa pierwszego rzędu, jest rozwiązaniem następującego równania różniczkowego: gdzie w(t)- szumbiały; dx(t) dt + αx(t) = w(t) α- odwrotność stałej czasowej procesu (gdy α=0, wtedy proces ten jest błądzeniem przypadkowym). c) Szum przefiltrowany filtrem środkowoprzepustowym[4]. Używany jest do modelowania źródeł szumu, które mają roczną okresowość, ale częstotliwość 1cykl/rok przecieka lub rozszerza się do sąsiednich pasm częstotliwości. Aby zamodelować ten proces, szum biały przepuszczany jest przez filtr, który pozwala przejść tylko częstotliwościom środkowym ok. 1cyklu/rok i graniczącym. Parametrami filtru środkowoprzepustowego są: - częstotliwość centralna, - szerokość pasma, - spadek przenoszenia w dziedzinie częstotliwości. d) Zmienny szumbiały. Szum o zmiennej amplitudzie. e) Szum biały ze zmiennym krokiem. Następuje zmiana w skali szumu białego, pomiędzy dwoma epokami. Musi być użyty z co najmniej jednym innym modelem szumu. f) Szum biały ze zmiennym czasem. Zanik wykładniczy w skali szumu białego.
3.3 Działanie programu Aktualnie istnieją dwa formaty plików wejściowych: 1. Plik CATS dla szeregów czasowych, z systemów takich jak GPS. 2. Plik PSMSL (ang. Permanent Service for Mean Sea Level) dla szeregów czasowych pomiarów poziomu morza. Format CATS składa się z dwóch części: informacji nagłówkowych i szeregów czasowych. Informacja nagłówkowa jest w zasadzie listą parametrów, dotyczących położenia odbiornika GPS, z którego pochodzą szeregi czasowe. Informacja ta (oraz jakikolwiek wiersz informacji, którego nie chcemy przetwarzać) zaczyna się symbolem #. Dane zawarte są w 7 kolumnach odnoszących się do czasu (wyrażony w latach,zapisany w ułamku dziesiętnym), kierunku północnego, kierunku wschodniego, kierunku pionowego, błędu w kierunku północnym, błędu w kierunku wschodnim, błędu w kierunku pionowym. Pozycje wyrażone są w metrach. Rys.2. Przykładowe dane wejściowe w formacie CATS Jeśli znane są nieciągłości lub przesunięcia w danych szeregach czasowych, mogą one zostać wyszczególnione w nagłówku pliku jako # offset decimal_datecomponent_code, gdzie: decimale_date jest to czas pojawienia się przesunięcia, a component_code jest
liczbą całkowitą, opisującą w którym z trzech kierunków należy wykonać przesunięcie. W celu przetworzenia danych należy wpisać wiersz poleceń zawierający opcje, które mogą zostać podzielone w trzy kategorie: model stochastyczny, model funkcjonalny i inne. Model stochastyczny jest zdefiniowany przy użyciu opcji model. Np. opcjadla modelu szumbiały plus różowymoże wyglądać następująco: --model pl : k-1 ---model wh: gdzie: pl: oznacza szum z zależności potęgowej, wh: oznacza szum biały, k ustala wykładnik widmowy. Model funkcjonalny jest domyślnie zdefiniowany jako funkcja zawierająca nachylenie, punkt przecięcia z osią OX i przesunięcia. Jeśli żądane jest oszacowanie amplitudy i fazy jakiegokolwiek okresu sygnału, wtedy wykorzystuje się opcję sinusoid. Kilka innych opcji to: - metoda, definiująca którą metodę estymacjiużyć; - verbose, wyprowadzająca dodatkowe informacje; -outputwymuszająca drukowanie wyników do pliku, zamiast wyświetlanie na ekranie. Wyniki mogą być prezentowane zarówno na ekranie (stdout) jak i do pliku, używając wspomnianej opcji output. 4. Analiza szeregu czasowego ze stacji JOZE W celu zaprezentowania analizy szeregów czasowych wybrano polską stację JOZE, która znajduje się w miejscowości Józefosław.
Rys.3. Stacja JOZE Długość otrzymanych szeregów czasowych obserwacji ze stacji JOZE wynosi 12 lat, dane te są rozwiązaniami dobowymi, natomiast do analizy została wybrana składowa północna współrzędnych stacji. Przed przetworzeniem danych w programie CATS, usunięto obserwacje odstające, czyli obserwacje nie należące do przedziału 3σ; 3σ, gdzie σ to odchylenie standardowe.
Rys.4. Otrzymane obserwacje składowej północnej współrzędnych stacji JOZE Rys.5. Składowa północna współrzędnych stacji JOZE bez obserwacji odstających
W celu przetworzenia danych, zostały zdefiniowane następujące modele: - model stochastyczny: założono istnienie szumu różowego i białego; - model funkcjonalny: założono występowanie sezonowości z okresem rocznym, półrocznym, 28 dni i 14 dni. Zastosowany wiersz poleceń: Catscommand :./cats320b --model wh: --model pl:k-1 --columns 4 --sinusoid 1y1 --sinusoid 28d --sinusoid 14d --verbose --output JOZE_N.txt JOZE_cats.txt Wyniki: +NORT INTER -87.3015 +- 0.5104 +NORT SLOPE 14.4679 +- 0.0992 +NORT SIN -0.0492 +- 0.0411 +NORT COS -0.3122 +- 0.1388 +NORT SIN -0.0471 +- 0.0299 +NORT COS 0.0451 +- 0.0293 +NORT SIN 0.0528 +- 0.0411 +NORT COS -0.0367 +- 0.0311 +NORT SIN -0.0284 +- 0.0206 +NORT COS 0.0198 +- 0.0107 +NORT WHITE NOISE +NORT WH 0.6056 +- 0.0319 +NORT POWER LAW NOISE +NORT INDEX -1.0000 +NORT PL 3.7490 +- 0.1174 a) Trend. W pliku wyjściowym wielkości odnoszące się do trendu to: INTER - punkt początkowy, przecięcie z osią OX w t 0, SLOPE - nachylenie. Trend liniowy szeregu czasowego obliczono z zależności: x(t i ) = x 0 + rt i, jest on przede wszystkim utożsamiany z ruchem bloków litosferycznych.
Rys.6. Wyznaczony trend liniowy Rys.7. Obserwacje po usunięciu trendu
b) Sezonowość. Program CATS wyznacza amplitudy oraz fazy funkcji sinus dla przyjętych okresów, według zależności: gdzie: A sin(ωt + φ) = A sin(ωt) cos(φ) + A cos(ωt) sin(φ) A cos(φ) - +NORT SIN A sin(φ) - +NORT COS A = (+NORT SIN) 2 + (+NORT COS) 2 Przyjęte okresy oscylacji odpowiadają: oscylacja roczna rok tropikalny, φ = tan 1 +NORT COS ( +NORT SIN ) oscylacja półroczna pół roku tropikalnego, oscylacja o okresie 28 dni miesiąc księżycowy, oscylacja o okresie 14 dni pół miesiąca księżycowego. Rys.8. Przyjęty model sezonowości
Rys.9. Zestawienie modelu sezonowości i obserwacji Rys.10. Szereg czasowy obserwacji po usunięciu trendu i sezonowości
c) Szum. Głównym parametrem obliczanym przez program CATS jest amplituda szumu, przyjętego w modelu stochastycznym. W danym szeregu czasowym znajduje się szum różowy o amplitudzie 3,749 [mm] oraz szum biały o amplitudzie 0,6056 [mm]. 5. Podsumowanie W pracy przedstawiono budowę i działanie programu CATS oraz analizę szeregu czasowego zmian składowej północnej współrzędnych stacji JOZE. Zaprezentowany program jest przede wszystkim przeznaczony do wyznaczenia parametrów oraz ich odchyleń standardowych dla przyjętego modelu stochastycznego i funkcjonalnego. LITERATURA [1] J. Zhang, Y. Bock, H. Johnson, P. Fang, S. Williams, J. Genrich, S. Wdowski, J. Behr, Southern California permanent GPS geodetic array: error analysis of daily position estimates and site velocities. J Geophys 1997. [2] A. Mao, CGA Harrison, TH Dixon, Noise in GPS coordinate time series. J Geophys, 1999. [3] SDP Williams, Y. Bock, P. Fang, P. Jamason, RM Nikolaidis, L. Prawirodirdjo, M. Miller, DJ Johnson, Error analysis of continuous GPS position time series.jgeophys 2004. [4] J. Langbein, Noise in two color electronic distance meter measurements revisited. J Geophys, 2004.
CATS: GPS coordinate time series analysis software Abstract. The paper presents CATS program, designed to study and compare stochastic noise processes in GPS coordinate time series. There was executed coordinate time series analysis for JOZE station, which contains in EUREF Permanent Network. Keywords: analysis of noise, CATS, time series