Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego pokładu węgla
|
|
- Seweryna Czerwińska
- 6 lat temu
- Przeglądów:
Transkrypt
1 WARSZTATY z cyklu Zagrożenia naturalne w górnictwie Mat. Symp. str Jerzy KORNOWSKI Główny Instytut Górnictwa, Katowice Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego pokładu węgla Streszczenie Praca ta stanowi część drugą dwuczęściowego cyklu dotyczącego prognozy sejsmoakustycznej (cześć pierwszą stanowi artykuł: Kurzeja (), dalej oznaczany krótko jako Cz. ) i przedstawia wyniki obszernych badań, w których korzystając z dużego zbioru jakościowo dobrych obserwacji z ZG Piekary porównano wyniki prognozowania (godzinowej logarytmicznej energii łącznej tzn. AE i wstrząsów) za pomocą różnych wariantów algorytmu prognozy liniowej. Algorytm ten wybrano wśród wielu możliwych ze względu na jego prostotę i dobrze rozwinięte podstawy teoretyczne. Stwierdzono, że nie wszystkie warianty metody są jednakowo dobre i że najlepsze z nich zapewniają na badanym zbiorze obserwacji skuteczność prognozy zbliżoną do 54% co oznacza że wariancja błędu prognozy wynosi około 46% wariancji obserwacji a wartość średnia błędu prognozy jest (na badanym zbiorze obserwacji) bardzo bliska zeru.. Wprowadzenie i przegląd problemów prognozy Prognoza zagrożenia sejsmicznego jest centralnym problemem sejsmoakustyki (AE) i sejsmologii górniczej. Przedmiotem prognozy może być albo czas, miejsce i energia przyszłego wstrząsu (taka prognoza jest marzeniem użytkowników, jest jednak bardzo trudna i na razie nieosiągalna), albo też zmienna w czasie i okresowo (co ΔT, np. co godzinę) liczona wartość zagrożenia definiowana (np. Kornowski ; patrz także Cz. ) jako prawdopodobieństwo, że łączna energia emisji (AE i wstrząsów) w nadchodzącej jednostce czasu ΔT, zawarta będzie w przedziale (E, E) energii dopuszczając E. W praktyce celowe jest ustalenie, dla wyrobiska w konkretnych warunkach, dolnej granicy E niebezpiecznej energii wstrząsu (np. Konopko 994; tabl. 8, także Dubiński i Konopko, str. 79) i definiowanie zagrożenia jako prawdopodobieństwa, że E (t, t + T) > E, wymagając równocześnie by okres T (obserwacji /interpretacji/prognozy) był znacznie krótszy od średniego czasu między niebezpiecznymi wstrząsami. Ponieważ energia łączna większa jest od energii samych wstrząsów a energia AE w ciągu T rzadko sięga wartości niebezpiecznych (np. 4 J), możliwe jest ustalenie ( alarmowego ) progu E na użytecznym i bezpiecznym poziomie. Prognoza nie tylko w geofizyce jest możliwa gdy dysponujemy zbiorem informacyjnym It danych/obserwacji związanych z przyszłymi wartościami prognozowanej wielkości Zt+τ (np. zagrożenia) oraz algorytmem/metodą/teorią (F) umożliwiającą wnioskowanie o Zt+τ na podstawie It. Gdy teoria ta ma postać matematyczną, nazywamy ją modelem prognozy (także modelem lub filtrem predykcyjnym). Wartość zmiennej x, wyprognozowaną algorytmem F na podstawie zbioru informacyjnego 33
2 J. KORNOWSKI Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... I t oznaczamy ~ x (I t, F) lub krócej x~ t rozumiejąc przez to, że x~ t (t, t+ T) = F(It). Fundamentem prognozy jest empirycznie i logicznie uzasadnione przekonanie, że im lepszy zbiór It i model F, tym bliżej teoretycznego optimum będą wyniki prognozy. Zastrzeżenie, iż wyniki prognozy zbliżać się mogą tylko do pewnego optimum, a nie do (bardzo pożądanej lecz zwykle nieosiągalnej) wartości prawdziwej (czyli przyszłej obserwacji) jest bardzo ważne, bo np. w przypadku szumu białego N (, s ) żaden, nawet idealny zbiór I t i model F nie dadzą prognoz o wariancji mniejszej od s (która może przecież być bardzo duża i odległa od oczekiwań/potrzeb praktyki!). Cała teoria i praktyka prognozy sprowadzają się do poszukiwania jak najlepszego modelu F oraz zbioru It. By najważniejsze problemy i warunki racjonalnej prognozy postawić jasno i potem do nich nie wracać, stwierdzić trzeba że: zajmujemy się tu prognozą, której zbiór informacyjny It składa się z minionych wartości log-energii łącznej Et = log(ewstrz + EAE + )t, obserwowanych w kolejnych przedziałach czasu T [E t jest skrótem symbolu E(t, t+ T)]. Taką prognozę nazywamy sejsmoakustyczną prognozą zagrożenia sejsmciznego (SPZS); inna zawartość It może być przyczyną innej nazwy metody/prognozy. Zauważmy, że zbiór I t z którego korzysta SPZS, jest bardzo ubogi i nie zawiera żadnych informacji geologicznych czy górniczych. Zagadnienie rozszerzenia bazy informacyjnej należy do podstawowych problemów prognozy zagrożenia sejsmicznego, w zagadnieniu SPZS nie występuje problem czasu (prognoza jest formułowana co T i dotyczy nadchodzącego T) ani miejsca (prognoza dotyczy ściany objętej obserwacją AE). A oto niektóre warunki konieczne SPZS: a) Konieczna jest lokalizacja wstrząsów tak, by zbiór I t nie został zaśmiecony wprowadzającymi w błąd zdarzeniami obcymi. b) Energie AE i wstrząsów muszą być addytywne (liczyć trzeba fizyczną, wyrażoną w dżulach J, energię AE, odrzucając tzw. energię umowną ). c) E wstrz i E AE zaobserwowane w minionym przedziale T muszą być równocześnie, co T, dostępne programowi który liczy E t (zatem tworzy zbiór I t) i prognozuje. d) Et (zatem Ewstrz oraz EAE) muszą być liczone z dokładnością zapewniającą użyteczność wyników. Dokładność prognoz energii nie będzie lepsza od dokładności obserwacji/estymacji energii (zdarzeń minionych) a grube błędy w It wywołają jeszcze większe błędy prognozy. e) Im krótsze są okresy T obserwacji i prognozy, tym większe są szanse zaobserwowania emisji poprzedzającej nagłą zmianę zagrożenia (być może wstrząs). Częstość obserwacji/interpretacji/prognozy winna zależeć od stanu zagrożenia. Okresy zmianowe ( T = 8 godzin) są reliktem epoki przedkomputerowej i powinny być radykalnie skrócone. f) Istnieć musi co najmniej pośredni związek między obserwowanymi (i wchodzącymi do I t) parametrami emisji AE a wstrząsami które decydują o zagrożeniu; związek ten Kornowski () nazwał postulatem jedności emisji uznając, że wspólną przyczyną AE i wstrząsów (o nieodległych źródłach) jest pole naprężeń (modyfikowane eksploatacją i niejednorodnościami). Postulat ten (w teorii) dopuszcza wnioskowanie o zagrożeniu {tzn. Z = F(I t)} w obszarze S tylko na podstawie zdarzeń z S i mających wspólną z zagrożeniem przyczynę. Oznacza to m.in. konieczność eliminowania hałasów i zakłóceń oraz konieczność teoretycznie poprawnego traktowania emisji związanej ze skrawaniem (zagadnienie to opisują tzw. sejsmoakustyczne równania stanu skrawanej ściany (Kornowski ) lecz wykracza to poza zakres niniejszej pracy). 34
3 WARSZTATY z cyklu Zagrożenia naturalne w górnictwie Określić jeszcze należy formę wyników prognozy i miarę jakości. W każdej chwili t, przyszła wartość energii łącznej E(t, t+ t) jest wielkością nieznaną, która traktowana być musi jako zmienna losowa opisana swym (ewoluującym) rozkładem prawdopodobieństwa (jeśli E(t, t- t) została już zaobserwowana, to jest wielkością znaną i deterministyczną: proces (z założenia: dokładnej) obserwacji przekształca wielkość nieznaną w znaną, a losową w deterministyczną). Kornowski () sugeruje, że błąd optymalnej prognozy E t łącznej log-energii może być dobrze aproksymowany jako N(, s ): Zatem z każdą jednostką czasu T, prognozować należy wartość E ~ t i jej wariancję s, a dla użytkownika najwygodniejsze jest korzystanie z α % przedziału ufności i prawdopodobieństwa przekroczenia wartości niebezpiecznej, E (prawdopodobieństwo to nazywamy zagrożeniem!). Prognoza w chwili t winna zatem mieć postać zdania: z prawdopodobieństwem 9%, E α < E ~ (t, t+ T) < E β, a prawdopodobieństwo że E(t, t+ t) > E wynosi Z" (przy czym E α, E β, Z to konkretne, liczone co T wartości, E ustala Dział Tąpań kopalni dla danego wyrobiska (np. korzystając z Tab. 5.4, Dubiński i Konopko ), a wartość 9% jest tylko przykładem (może być 95%)). Dział Tąpań kopalni winien wiedzieć jak informację tę w praktyce wykorzystać, a przepisy/instrukcje winny to ułatwiać. Ponieważ wartość średnia błędów optymalnej prognozy jest zerem, dobrą miarą jakości prognozy jest iloraz: gdzie: S to wariancja błędu prognozy b obs S to wariancja obserwacji. VARNOR = 35 obs S b /S (.) W terminologii regresji liniowej, VARNOR = R gdzie R to współczynnik determinacji. Jest to ocena statystyczna, wymagająca wielu prób/prognoz i wykluczająca osądzanie wyników (także modelu i zbioru It) na podstawie pojedynczych (lub nielicznych) przypadków. Wśród dostępnych nam wyników obserwacji z kopalń, dane ze ściany 33/5 Zakładu Górniczego Piekary najbliższe były spełnienia warunków SPZS, toteż te właśnie obserwacje wykorzystano. Oznacza to jednak, że zakres ważności przedstawianych wyników ograniczony jest do warunków słabego lub co najwyżej średniego zagrożenia tąpaniami. Przedmiotem tej pracy są wyniki badań porównawczych zdolności predykcyjnej (mierzonej wartością VARNOR) i użyteczności praktycznej (uwzględniającej też prostotę/złożoność metody) szeregu wariantów znanej metody prognozy liniowe za pomocą przybliżonych filtrów Wienera. Algorytmy opisane były (m.in.) w Cz., tu podane są wyniki prognozy i niektóre informacje szczegółowe.. Wyniki prognozy liniowej.. Opis zadania i przykładowe wyniki Prognozą liniową nazywamy obliczanie, w każdej dyskretnej chwili t (t = i T, i =,,...) wartości: x t+ = a x t + a x t a Lx t-l+ (.)
4 J. KORNOWSKI Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... gdzie: a wektor parametrów (a,...,a L) nazywamy (liniowym) predyktorem (także filtrem predykcyjnym) rzędu L. Na przykład x t mogą to być wartości log-energii łącznej w kolejnych jednostkach T (np. w kolejnych godzinach) i wówczas równanie (.) realizuje sejsmoakustyczną prognozę zagrożenia sejsmicznego (SPZS) wykorzystując zbiór I t = (x,..., x t) i model (.). Prognozę liniową nazywamy optymalną gdy wartości (a,...,a L oraz L) dobrane są w sposób gwarantujący minimalizację średniokwadratowego błędu prognozy a w praktyce ponieważ właściwie dobrany filtr (.) jest tak zwanym estymatorem nieobciążonym czyli gwarantującym że średni błąd prognozy jest zerem gdy zapewniona jest minimalizacja wariancji (VARNOR) błędu prognozy. Istnieje obszerna literatura dotycząca optymalizacji parametrów filtru predykcyjnego (Robinson i Treitel 98; Box i Jenkins 97; Burg 975), zagadnienie to opisano także w Cz., tutaj więc przypomnieć wystarczy że warunkiem użyteczności metody (prognozy liniowej) jest występowanie (dla przesunięcia τ > ) istotnie różnej od zera autokorelacji r(τ) w szeregu czasowym (x t) obserwowanych i prognozowanych wielkości. Brak istotnej autokorelacji wyklucza użyteczność prognozy liniowej. Zagadnienie autokorelacji w szeregach czasowych emitowanej energii (AE, wstrząsów i łącznej) dyskutowane było i ilustrowane przykładami w pracach Kornowskiego i Kurzeji (), Kornowskiego (), a także w Cz. gdzie stwierdzono, że autokorelacja taka występuje w stopniu uzasadniającym stosowanie prognozy liniowej. Zauważyć też trzeba że (przed przystąpieniem do prognozy) niewiadomymi są zarówno parametry filtru predykcyjnego (a,...,a L) jaki jego rząd L, i wyznaczyć trzeba zarówno L jak i parametry; ponadto nowoczesne algorytmy estymujące optymalne wartości parametrów filtru, obliczają też (zakładając stacjonarność procesu np. emisji energii łącznej) przybliżoną wariancję błędu prognozy. Ponieważ błąd prognozy logarytmicznej energii łącznie ma rozkład w przybliżeniu normalny (z wartością średnią ), znajomość wariancji wystarcza do określenia przedziałów ufności. Przykład prognozy dla 9 tygodni obserwacji energii łącznej z ść 33/5 ZG Piekary i jej wyników pokazano na rysunku.. i.. Na rysunku.. widzimy trzy pary wykresów a każda para dotyczy trzytygodniowego okresu obserwacji i składa się z: wykresu górnego, przedstawiającego (przebieg środkowy) obserwowane wartości godzinowej log-energii łącznej wewnątrz (wykresy powyżej i poniżej) 9% przedziału ufności dla prognozy, wykresu dolnego przedstawiającego błędy prognozy. Można zauważyć, że energia obserwowana czasami lecz niezbyt często wykracza poza granice 9% przedziału ufności co jest zrozumiałe (można, oczywiście, wyznaczyć przedziały bardziej pewne, np. 95% lub 99%, lecz nie wydaje się to celowe). Na rysunku.. pokazano z lewej dla obserwowanych wartości log-energii łącznej, z prawej dla błędów prognozy od góry: autokorelację, histogram częstości występowania (czyli przybliżony rozkład gęstości prawdopodobieństwa) danej wartości oraz widmo szeregu czasowego (obserwowanej godzinowej log-energii lub błędu prognozy tej energii). Zauważyć należy, że w autokorelacji obserwacji bardzo wyraźna jest składowa okresowa o okresie 68 godzin ( tydzień), wymuszona rytmem produkcji, a w widmie widoczne są też składowe o okresie T = i T = 4 godziny; ponadto histogram obserwacji jest zdecydowanie odległy od (zaznaczonego na jego tle) rozkładu normalnego o tej samej średniej i wariancji. Pokazana z prawej strony rysunku.. autokorelacja błędów predykcji nie różni się w sposób istotny od szumu białego [r(τ) <,96/ 53 nie jest więc istotna], choć w widmie znaleźć można jeszcze oznaki składowych i 4-godzinnych. Histogram błędów predykcji znacznie 36
5 WARSZTATY z cyklu Zagrożenia naturalne w górnictwie bardziej przypomina rozkład normalny (choć w sensie ścisłym nie jest nim) o wartości średniej,6 (a więc bliskiej zera) i wariancji σ =,9... Prognoza modelem autoregresji rzędu L 5 Metoda prognozy liniowej dostosowana jest do przetwarzania wsadowego i dla ustalonego zbioru (x k, x k+,..., x k+n-) obserwacji o liczebności N, określa parametry (L opt; a i, i=,..., L opt; s ) filtru predykcyjnego. Ponieważ jednak poszukiwanie optymalnego rzędu (optymalnej długości) filtru, L opt, odbywa się porównując jakość coraz to dłuższych filtrów (L =,,..., L max), zadana musi zostać pewna wartość maksymalna, L max, by program nie liczył w nieskończoność. Od wyboru tej wartości (L max) również zależeć może ostateczna jakość prognozy. Ponieważ w przypadku obserwacji godzinowych dane napływają sekwencyjnie (co godzinę), oprócz wartości L max określić trzeba szerokość (N) okna czasowego na którym, dla zadanej wartości L max, algorytm estymuje (L opt; a i, i=,...l opt; s ) a także określić trzeba krok (KROK) tego okna, gdyż (choć prognoza robiona jest co godzinę) filtr obliczać można (np.) co godzinę, albo co dobę, albo co tydzień, albo w ogóle tylko raz (na początku, gdy uruchamiany jest algorytm). Ponadto, przed każdym obliczeniem filtru (L opt, a i, s ) ze zbioru (x k, x k+,..., x k+n-) można usuwać wartość średnią x (k, k+n) lub można jej nie usuwać. Istnieje więc ogromna liczba możliwych przypadków i wariantów, a próba wyboru optymalnego sposobu prognozy (tylko metodą prognozy liniowej i tylko na jednym, 9-tygodniowym zbiorze obserwacji z ść 33/5 ZG Piekary) wymaga bardzo obszernego eksperymentu numerycznego. Wyniki tego eksperymentu, zawsze określone wartością VARNOR, znormalizowanego błędu prognozy, przedstawiono w tabeli.. 5 loge/h loge/h loge/h loge/h loge/h loge/h t[h] t[h] t[h] t[h] t[h] t[h] Rys... Wyniki prognozy dziewięciotygodniowej (5 godz.) obserwacji godzinowej logarytmicznej energii łącznej (AE + wstrząsów) ze ść 33/5 ZG Piekary (zagrożenie słabe do średniego). W wierszach, 3, 5 energia obserwowana wraz z 9% przedziałem ufności dla prognozy (zauważ sporadyczne wykroczenia obserwacji poza granice 9% przedziału ufności). W wierszach, 4, 6 błędy prognozy godzinowej log-energii łącznej. Obserwacje rozpoczęto w poniedziałek, godz. 6 Fig... Results of nine-weeks prediction of AE and mining tremors energy 37
6 J. KORNOWSKI Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... g(x) r( ).5 x =,9 =,4 5 x = loge/h g(x) 5 r( ).5 x =,6 =,9 - x = loge/h (h) db - (h) db T[h] T[h] T(h) T[h] T(h) Rys... Statystyczne charakterystyki obserwacji (z lewej) i błędów prognozy (z prawej) pokazanych na rysunku.. Od góry: histogram danych na tle rozkładu normalnego o tej samej średniej i wariancji (zauważ wartości x oraz σ ), w środku: funkcja autokorelacji obliczona na podstawie 5 wartości danych (w r(τ) obserwacji zauważ składową okresową o okresie tygodniowym), u dołu: widmo szeregu czasowego godzinowych obserwacji błędów prognozy Fig... The statistic characteristics of observation and prediction errors showed on Fig... Użyty do estymacji parametrów a i algorytm pochodził z pracy Kalouptsidisa i innych (985) i został zmodyfikowany przez autora między innymi poprzez wprowadzenie kryterium FPE (patrz Cz. ) do wyznaczania optymalnej długości filtru L opt. W tabeli.. uwzględniono tylko skrajne wartości ( oraz ) parametru KROK, i dla KROK = parametry (L opt, a i, i=,... L opt) estymowano co godzinę, a dla KROK = parametry te estymowano tylko raz, na początku przetwarzania ciągu obserwacji. Dla innych wartości tego parametru (KROK) otrzymuje się wyniki pośrednie, zrezygnowano więc z ich przedstawiania. Szerokość okna, N, określono w godzinach (68 godzin to tydzień). Symbol x t oznacza estymację parametrów bez usuwania wartości średniej ze zbioru obserwacji, symbol x t- x oznacza, że ze zbioru (x K,..., x K+N-) przed estymacją filtra (L opt, a i, s ) usunięto średnią: x (k, N) = N - (x k + x K x K+N-) (.) Wartość VARMOR =,47 oznacza że prognoza usuwa 53% wariancji z ciągu obserwacji, VARNOR = oznacza prognozę idealnie dokładną a VARNOR = oznacza, że prognozowano wartość średnią ciągu obserwacji. Pamiętając, że wyniki uzyskano na zbiorze 53 obserwacji godzinowych z ZG Piekary są to więc wyniki wiarygodne w warunkach umiarkowanego stanu zagrożenia tąpaniami, zawarte w tabeli.. wyniki podsumować można następującymi wnioskami: W. Zastosowana metoda i wykorzystany zbiór obserwacji, w obszarze dopuszczonych długości filtru, umożliwiają prognozę ze średnią jakością. Błędy prognozy mają wartość 38
7 WARSZTATY z cyklu Zagrożenia naturalne w górnictwie średnią (nie ilustrowaną w tabeli.., lecz widoczną na histogramie, rysunek.. z prawej) w przybliżeniu równą zero i wariancję, w najlepszym przypadku, wynoszącą około 47% wariancji ciągu obserwacji. W. Usuwanie średniej poprawia jakość prognoz systematycznie lecz bardzo nieznacznie (VARNOR maleje nie więcej jak o %). Tabela.. Wartości VARNOR znormalizowanej wariancji błędu prognozy liniowej w zależności od szerokości okna (N) i dopuszczalnej długości Lmax filtru, dla parametrów KROK = i KROK oraz dla przypadków usuwania i nie usuwania średniej x ze zbioru przed estymacją parametrów filtru. Wyniki uzyskano dla 53 godzinowych obserwacji (9 tygodni) log-energii łącznej ze ść 33/5 ZG Piekary Table.. Values VARNOR of normalised variance of linear prediction error L max x N [godz.] KROK x t x t - x x t x t x x t x t x x t x t x x t x t x x t x t x min (5, N/) x t x t x Uwaga: podane wartości należy podzielić przez W3. Wzrost długości okna (N) poprawia jakość prognozy, lecz niezbyt systematycznie i w niewielkim stopniu (wzrost wartości N od 68 do 84 powoduje spadek VARNOR o 4%). Sugeruje to stacjonarność procesu emisji. 39
8 J. KORNOWSKI Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... W4. Wpływ kroku okna (KROK) niewielki i niesystematyczny dla filtrów krótkich, staje się wyraźny dla L max, gdzie widać, że jakość prognozy pogarsza się ze wzrostem długości kroku, co jest nieuniknione w przypadku lokalnych nie stacjonarności emisji. W praktyce kopalnianej, krok o umiarkowanej długości np. tygodniowy, tzn. KROK = 68, co oznacza aktualizację parametrów raz w tygodniu powinien okazać się rozwiązaniem racjonalnym. W5. Filtry krótkie, np. ograniczone wartością L max = 5, zapewniają prognozę lepszą od filtrów długich. Wynik ten jest bardzo ważny, gdyż decyduje o prostocie i efektywności obliczeń (wynik ten, choć z pozoru zaskakujący bo filtry krótkie są podzbiorem filtrów długich jest znany w teorii prognozy liniowej), równocześnie ograniczając obszar dalszych badań..3. Prognoza modelem jednoparametrowym uwzględniającym okresowość Ewidentna obecność (w obserwowanych wartościach łącznej godzinowej log-energii, patrz rys...) składowej okresowej o okresie tygodniowym bez wątpienia wymuszona procesem produkcji skłoniła autora (we współpracy z Autorką Cz. ) do próby wykorzystania modelu: x(t) = αx(t ) + ( α) x (t 68) (.3) gdzie: α. W modelu tym występuje tylko jeden parametr (α) którego optymalną (minimalizującą błąd dopasowania w oknie czasowym o szerokości N) wartość znajduje się przy pomocy algorytmu tzw. złotego podziału. Zwracam jednak uwagę, że podane dalej wartości VARNOR określają znormalizowaną wariancję błędu predykcji, a nie dopasowania. Dla α = otrzymuje się model: x(t) = x( t ) (.4a) Optymalny dla procesu przyrostów niezależnych (zwanego też ruchem Browna lub procesem błądzenia przypadkowego ang.: random walk). Model ten sugeruje, że jak było w minionej godzinie, tak będzie w następnej i jest bardzo popularny w wielu zastosowaniach, także w sejsmoakustyce, gdzie obowiązująca Instrukcja (implicite) utożsamia prognozę (na okres t+) z oceną zagrożenia (w okresie t). W przypadku α = otrzymuje się model optymalny dla procesu okresowego o okresie tygodniowym, zaburzonego białym szumem: x(t) = x(t 68) (.4b) Postać autokorelacji obserwacji (rys...) sugeruje, że i ten model powinien być brany pod uwagę. Postać ogólna modelu jednoparametrowego (.3) dopuszcza jak się wydaje dowolną mieszaninę tych procesów uznano więc, że stanowić może model warty zbadania. Jak poprzednio, możliwa jest wielka liczba wariantów algorytmu prognozy ze względu na długość okna czasowego (N) i jego krok (KROK). {badano także dodatkowo celowość zastąpienia członu x(t 68) w równaniach (.3) i (.4b), członem K - [x(t 68) + x (t 68) x (t K 68)] dla różnych wartości K nie otrzymując jednak wyników lepszych od otrzymanych dla K =, stąd ograniczamy się do K = }. Otrzymane wyniki przedstawiono w tabeli.., określającej znormalizowany błąd prognozy VARNOR dla optymalnych wartości parametru α zależnie od wartości parametrów N oraz KROK. 4
9 WARSZTATY z cyklu Zagrożenia naturalne w górnictwie Tabela.. Wartości VARNOR, znormalizowanej wariancji błędu prognozy optymalnym filtrem jednoparametrowym (4) w zależności od szerokości okna (N) i od kroku okna (KROK) Table.. Values VARNOR of normalised variance of prediction error of one-parameter filter N KROK Uwaga: podane wartości należy podzielić przez. Badano ponadto wartości VARNOR dla α = (czyli zakładając błądzenie przypadkowe ) oraz dla α = (czyli zakładając proces okresowy na tle białego szumu) w obu przypadkach otrzymując systematycznie wartości znacznie większe od pokazanych w tabeli.. (dla α = typowo VARNOR,59, dla α = typowo VARNOR > ), co upoważnia do ważnego wniosku: W6. Proces (szereg czasowy) utworzony z godzinowych wartości łącznej log-energii (obserwowanej w ścianie 33/5 ZG Piekary) nie może być aproksymowany ani modelem przyrostów niezależnych (który zwany jest też ruchem Browna lub błądzeniem przypadkowym) ani, tym bardziej, modelem procesu okresowego na tle szumu białego. Ponadto, porównanie wartości VARNOR w tabela.. i w tabeli.. upoważnia do wniosku. W7. Prognoza modelem jednoparametrowym (4) uwzględniającym okresowość daje wyniki w sposób istotny gorsze od wyników standardowej prognozy liniowej. Zauważmy na koniec, że model (4) może być traktowany jako szczególny przypadek predyktora liniowego, krótkiego lecz bardzo wysokiego rzędu (L = 68) z narzuconymi bardzo silnymi ograniczeniami (a i =, i =, 3,..., 67; a = a 68)..4. Jeszcze trzy modele liniowe Celem pełniejszego wyjaśnienia i zrozumienia możliwości prognozy krótkimi optymalnymi filtrami predykcyjnymi, pojęto badanie filtrów: M : x(t) = a x (t-) (.5a) M : x(t) = b x (t-) + b x (t-) (.5b) 3 M 68 : x(t) = q x (t-) + q x (t-) + q 3x (t-68) (.5c) na tym samym zbiorze danych z ZG Piekary. Wyniki prognozy podano poniżej w tabeli.3. i.4. 4
10 J. KORNOWSKI Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... Ponieważ optymalne wartości parametrów filtrów znajduje się rozwiązując tzw. równania normalne prognozy (patrz Cz. ) zwykle wykorzystując przy tym wartości autokorelacji, r(τ), zbioru obserwacji, powstaje dodatkowo cały szereg możliwości obliczeniowych (wariantów metody) można bowiem autokorelację liczyć usuwając uprzednio wartość średnią ze zbioru obserwacji lub jej nie usuwając, ponadto w każdym przypadku stosować można tzw. obciążony: lub nieobciążony: N τ r o(τ) = N - τ r n(τ) = (N-τ) - x(t)x(t τ) (.6a) N τ τ x(t)x(t τ) (.6b) estymator autokorelacji. Wyniki podane w tabeli.3. dotyczą wyłącznie przypadku prognozy wykorzystującej (do obliczenia optymalnych parametrów filtru a lub b i b ) obciążony estymator r o(τ) obliczany po usunięciu wartości średniej ze zbioru (dotychczasowych) obserwacji. Przyczyna tego wyjaśniona będzie poniżej. Tabela.3. Wartość VARNOR oraz wartości średnie ε błędu predykcji dla 53 godzinowych obserwacji logenergii łącznej w przypadku prognozy optymalnym filtrem pierwszego (M) i drugiego (M) rzędu Table.3. Values VARNOR and average prediction error for 53 hours observation log-energy KROK 4 68 N M M M M M M M M M 336 VARNOR ε,,,3,,4,3,,6 54 VARNOR ε,3,,3,,4,3,9,4 67 VARNOR ε,4,3,4,3,5,4,7,3 84 VARNOR ε,5,3,5,3,6,4,6,3 Uwaga: wartości VARNOR podzielić należy przez Z tabeli.. wynikają kolejne, istotne wnioski: W8: Model M umożliwia usunięcie około 49% wariancji a model M około 53% wariancji ze zbioru obserwacji. Nawet najlepsze z wyników podanych w tabeli.. nie są istotnie lepsze od uzyskanych modelem M. W9: Średni błąd kwadratowy jest sumą wariancji i kwadratu błędu średniego. Uwzględnienie kwadratu błędu średniego (który jest bliski zera zawsze prócz przypadku KROK = ) wyjaśnia pozornie bardzo dobre działanie filtrów, które są raz tylko (na początku procesu prognozy) estymowane a potem stosowane bez zmiany: w rzeczywistości filtry te nie gwarantują zerowej średniej wartości błędu predykcji i parametr VARNOR nie jest dla 4
11 WARSZTATY z cyklu Zagrożenia naturalne w górnictwie nich właściwą miarą jakości (lepszą miarą jest średni błąd kwadratowy). 3 Ostatnia seria obliczeń związana była z optymalizacją i zastosowaniem filtru M 68 określonego równaniem (6c). Jest to filtr wprawdzie krótki (trzyelementowy) lecz tak wysokiego rzędu (L = 68) że stosowanie standardowych metod estymacji uznano za niecelowe. Równocześnie filtr ten umożliwia uwzględnienie składowej okresowej o okresie tygodniowym, a porównanie uzyskanych wyników z wynikami uzyskanymi przy użyciu M umożliwia ocenę informacji zawartej w składowej okresowej. Wyniki przedstawione w tabeli.4. dotyczą tylko przypadku wykorzystania obciążonego estymatora autokorelacji (7a ). Wyniki uzyskane stosując estymator nieobciążony były systematycznie gorsze ich przedstawianie uznano więc za niecelowe. Analiza tabeli.4. i porównanie z tabeli.3. skłania do następujących wniosków. M umożliwia w najlepszym przypadku (N = 54, KROK = 68) prognozę z błędem W: 3 68 VARNOR,46 ( =,3, VARNOR +,46) o około,5% mniejszym niż za pomocą filtru M. Jest to zaskakująco mała poprawa jakości prognozy, być może warta głębszej analizy. W: Jak poprzednio, usuwanie średniej (ze zbioru obserwacji) i wykorzystanie obciążonego estymatora autokorelacji poprawia wyniki w stopniu niewielkim lecz systematycznie, winno więc być zawsze stosowane. Prognoza filtrem którego współczynniki są tylko raz liczone, prowadzi do wyników gorszych od uzyskanych filtrem okresowo aktualizowanym. Wyniki podane w tabeli.4. sugerują też, że racjonalne jest aktualizowanie filtru raz w tygodniu i stosowanie okna N = 54. Tabela.4. Wartości VARNOR (wariancji znormalizowanej błędu prognozy) oraz średniego błędu prognozy filtrem M 3 68 dla różnych wartości kroku (krok) okna i szerokości (N) okna, gdy z obserwacji usuwano (x x ) wartość średnią i gdy jej nie usuwano (xt) Values VARNOR and average prediction error of M 3 68 filter KROK Table.4. N x t x - x x t x - x x t x - x x t x - x 336 VARNOR ε VARNOR ε VARNOR ε VARNOR ε Uwaga: wartości VARNOR należy podzielić przez 3. Wnioski. Na obszernym zbiorze obserwacji z ZG Piekary wykazano, że możliwa jest prognoza liniowa godzinowych wartości logarytmicznej energii łącznej (AE i wstrząsów) ze
12 J. KORNOWSKI Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... sprawnością (czyli jakością, mierzoną parametrem VARNOR = -R określającym redukcję wariancji wskutek prognozy) lepszą od 5%. Wartość liczbowa VARNOR zależy od zbioru obserwacji może więc być traktowana tylko jako przykład.. Optymalną prognozę liniową umożliwiają filtry bardzo krótkie, 5 elementowe, zatem łatwe do obliczenia i stosowania. 3. Uzyskane wyniki wskazują, że estymację parametrów filtru predykcyjnego można i warto powtarzać raz w tygodniu (a potem przez tydzień stosować obliczone wartości parametrów): zapewnia to wystarczającą adaptacyjność (zdolność dostosowania się do zmiennych warunków) metody. 4. Jeżeli do estymacji filtru wykorzystywana jest autokorelacja, stosować należy estymator obciążony, r o(τ), zawsze najpierw usuwając wartość średnią. 5. Cała procedura estymacji filtru predykcyjnego i prognozy tym filtrem jest tak prosta że jeśli obsługa Stacji Geofizycznej zapewni dopływ (do komputera PC) godzinowych wartości fizycznej (wyrażonej w dżulach, J) energii AE i wstrząsów może działać całkowicie automatycznie, nie kolidując z obowiązującymi metodami (sejsmoakustyczną i sejsmologiczna) i dostarczając dodatkową informację o zagrożeniu która łatwo może być ilościowo sprawdzona. Literatura [] Box G. E. P., Jenkins G. M. 97: Time Series Analysis Forecasting and Control. San Francisco, Holden-Day. [] Burg J. P. 975: Maximum Entropy Spectral Analysis. Ph. D. Dissertation, Stanford Univ. [3] Dubiński J., Konopko W. : Tąpania: ocena, prognoza, zwalczanie. Katowice, GIG. [4] Kalouptsidis N., Carayannis G., Manolakis D., Koukoutsis D. 985: Efficient Recursive in Order Least Squares FIR filtering and Prediction. IEEE Trans. Acoust. Speech Sign. Processing, ASSP-33, [5] Konopko W. 994: Doświadczalne podstawy kwalifikowania wyrobisk górniczych w kopalniach węgla kamiennego do stopni zagrożenia tąpaniami. Prace Naukowe GIG nr 795, Katowice. [6] Kornowski J. : Podstawy sejsmoakustycznej oceny i prognozy zagrożenia sejsmicznego w górnictwie. GIG, Katowice. [7] Kornowski J., Kurzeja J. : Korelacja energii wstrząsów górniczych z emisją sejsmoakustyczną i ocena możliwości jej wykorzystania w matematycznych modelach prognozy. Mat. XXIII Zim. Szk. Mechaniki Górotworu, Wyd. Katedra Geomech. Górn. i Geotech. AGH, Kraków, [8] Kurzeja J. : Podstawy sejsmoakustycznej prognozy energii emitowanej z eksploatowanego pokładu węgla. Mat. Symp. Warsztaty. [9] Robinson E., Treitel S. 98: Geophysical Signal Analysis. Englewood Cliffs N. J., Prentice-Hall. The examples of seismoacoustic energy prediction emitted from exploited hand coal bed Results of experimental investigations have been presented, comparing performance (as measured by variance reduction factor) of many variants of the linear prediction method, when used to predict hourly observed energy of seismic and seismoacoustic (AE) emission from a longwall in Piekary Coal Mine. We conclude that not all the variants of the linear prediction behave equally well and that due to the best of them approximately 54% reduction of variance is possible for this set of observations. 44 Przekazano: 8 marca
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Rozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
LABORATORIUM Z FIZYKI
LABORATORIUM Z FIZYKI LABORATORIUM Z FIZYKI I PRACOWNIA FIZYCZNA C w Gliwicach Gliwice, ul. Konarskiego 22, pokoje 52-54 Regulamin pracowni i organizacja zajęć Sprawozdanie (strona tytułowa, karta pomiarowa)
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Sejsmoakustyczna prognoza intensywności uwalniania energii sejsmicznej w kolejnych jednostkach czasu na podstawie danych z ZG Piekary
Mat. Symp., str.465-475 Joanna KURZEJA Główny Instytut Górnictwa, Katowice Sejsmoakustyczna prognoza intensywności uwalniania energii sejsmicznej w kolejnych jednostkach czasu na podstawie danych z ZG
Andrzej SURMA*, Jerzy KORNOWSKI**, Joanna KURZEJA** *Katowicki Holding Węglowy S.A., KWK Wesoła, Mysłowice **Główny Instytut Górnictwa, Katowice
WARSZTATY 3 z cyklu Zagrożenia naturalne w górnictwie Mat. Symp. str. 365 38 Andrzej SURMA*, Jerzy KORNOWSKI**, Joanna KURZEJA** *Katowicki Holding Węglowy S.A., KWK Wesoła, Mysłowice **Główny Instytut
Ćwiczenie 5 PROGNOZOWANIE
Ćwiczenie 5 PROGNOZOWANIE Prognozowanie jest procesem przewidywania przyszłych zdarzeń. Obszary zastosowań prognozowania obejmują np. analizę danych giełdowych, przewidywanie zapotrzebowania na pracowników,
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński
Wstęp do teorii niepewności pomiaru Danuta J. Michczyńska Adam Michczyński Podstawowe informacje: Strona Politechniki Śląskiej: www.polsl.pl Instytut Fizyki / strona własna Instytutu / Dydaktyka / I Pracownia
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
WYKŁAD 5 TEORIA ESTYMACJI II
WYKŁAD 5 TEORIA ESTYMACJI II Teoria estymacji (wyznaczanie przedziałów ufności, błąd badania statystycznego, poziom ufności, minimalna liczba pomiarów). PRÓBA Próba powinna być reprezentacyjna tj. jak
Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Metody oceny stanu zagrożenia tąpaniami wyrobisk górniczych w kopalniach węgla kamiennego. Praca zbiorowa pod redakcją Józefa Kabiesza
Metody oceny stanu zagrożenia tąpaniami wyrobisk górniczych w kopalniach węgla kamiennego Praca zbiorowa pod redakcją Józefa Kabiesza GŁÓWNY INSTYTUT GÓRNICTWA Katowice 2010 Spis treści 1. Wprowadzenie
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010
STATYSTYKA MATEMATYCZNA WYKŁAD 14 18 stycznia 2010 Model statystyczny ROZKŁAD DWUMIANOWY ( ) {0, 1,, n}, {P θ, θ (0, 1)}, n ustalone P θ {K = k} = ( ) n θ k (1 θ) n k, k k = 0, 1,, n Geneza: Rozkład Bernoulliego
Metoda największej wiarygodności
Metoda największej wiarygodności Próbki w obecności tła Funkcja wiarygodności Iloraz wiarygodności Pomiary o różnej dokładności Obciążenie Informacja z próby i nierówność informacyjna Wariancja minimalna
Komputerowa Analiza Danych Doświadczalnych
Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11, środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd
Sposoby opisu i modelowania zakłóceń kanałowych
INSTYTUT TELEKOMUNIKACJI ZAKŁAD RADIOKOMUNIKACJI Instrukcja laboratoryjna z przedmiotu Podstawy Telekomunikacji Sposoby opisu i modelowania zakłóceń kanałowych Warszawa 2010r. 1. Cel ćwiczeń: Celem ćwiczeń
WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH
WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH Dobrze przygotowane sprawozdanie powinno zawierać następujące elementy: 1. Krótki wstęp - maksymalnie pół strony. W krótki i zwięzły
Podstawy sejsmoakustycznej prognozy energii emitowanej z eksploatowanego pokładu węgla
Mat. Symp. str. 45 59 Joanna KURZEJA Główny Instytut Górnictwa, Katowice Podstawy sejsmoakustycznej prognozy energii emitowanej z eksploatowanego pokładu węgla Streszczenie Celem pracy jest przedstawienie
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Statystyka opisowa. Wykład V. Regresja liniowa wieloraka
Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
3. Analiza własności szeregu czasowego i wybór typu modelu
3. Analiza własności szeregu czasowego i wybór typu modelu 1. Metody analizy własności szeregu czasowego obserwacji 1.1. Analiza wykresu szeregu czasowego 1.2. Analiza statystyk opisowych zmiennej prognozowanej
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Szeregi czasowe, analiza zależności krótkoi długozasięgowych
Szeregi czasowe, analiza zależności krótkoi długozasięgowych Rafał Weron rweron@im.pwr.wroc.pl Definicje Mając dany proces {X t } autokowariancję definiujemy jako : γ(t, t ) = cov(x t, X t ) = = E[(X t
Prognoza terminu sadzenia rozsady sałaty w uprawach szklarniowych. Janusz Górczyński, Jolanta Kobryń, Wojciech Zieliński
Prognoza terminu sadzenia rozsady sałaty w uprawach szklarniowych Janusz Górczyński, Jolanta Kobryń, Wojciech Zieliński Streszczenie. W uprawach szklarniowych sałaty pojawia się następujący problem: kiedy
Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki
Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Przetwarzanie Sygnałów Studia Podyplomowe, Automatyka i Robotyka. Wstęp teoretyczny Zmienne losowe Zmienne losowe
... prognozowanie nie jest celem samym w sobie a jedynie narzędziem do celu...
4 Prognozowanie historyczne Prognozowanie - przewidywanie przyszłych zdarzeń w oparciu dane - podstawowy element w podejmowaniu decyzji... prognozowanie nie jest celem samym w sobie a jedynie narzędziem
KORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
KRÓTKOOKRESOWA PROGNOZA INDUKOWANEGO ZAGROŻENIA SEJSMICZNEGO W GÓRNICTWIE
PRACE NAUKOWE GIG GÓRNICTWO I ŚRODOWISKO RESEARCH REPORTS MINING AND ENVIRONMENT Kwartalnik Quarterly 1/2005 Jerzy Kornowski, Joanna Kurzeja KRÓTKOOKRESOWA PROGNOZA INDUKOWANEGO ZAGROŻENIA SEJSMICZNEGO
1 Podstawy rachunku prawdopodobieństwa
1 Podstawy rachunku prawdopodobieństwa Dystrybuantą zmiennej losowej X nazywamy prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, tzn. F (x) = P [X < x]. 1. dla zmiennej losowej
3. Modele tendencji czasowej w prognozowaniu
II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa
Rozkład normalny, niepewność standardowa typu A
Podstawy Metrologii i Technik Eksperymentu Laboratorium Rozkład normalny, niepewność standardowa typu A Instrukcja do ćwiczenia nr 1 Zakład Miernictwa i Ochrony Atmosfery Wrocław, listopad 2010 r. Podstawy
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =
HISTOGRAM W pewnych przypadkach interesuje nas nie tylko określenie prawdziwej wartości mierzonej wielkości, ale także zbadanie całego rozkład prawdopodobieństwa wyników pomiarów. W takim przypadku wyniki
5. Model sezonowości i autoregresji zmiennej prognozowanej
5. Model sezonowości i autoregresji zmiennej prognozowanej 1. Model Sezonowości kwartalnej i autoregresji zmiennej prognozowanej (rząd istotnej autokorelacji K = 1) Szacowana postać: y = c Q + ρ y, t =
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
LABORATORIUM PODSTAW TELEKOMUNIKACJI
WOJSKOWA AKADEMIA TECHNICZNA im. Jarosława Dąbrowskiego w Warszawie Wydział Elektroniki LABORATORIUM PODSTAW TELEKOMUNIKACJI Grupa Podgrupa Data wykonania ćwiczenia Ćwiczenie prowadził... Skład podgrupy:
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Stosowana Analiza Regresji
prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA Powtórka Powtórki Kowiariancja cov xy lub c xy - kierunek zależności Współczynnik korelacji liniowej Pearsona r siła liniowej zależności Istotność
OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp
tel.: +48 662 635 712 Liczba stron: 15 Data: 20.07.2010r OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA z wykorzystaniem programu obliczeniowego Q maxp DŁUGIE
Estymacja przedziałowa. Przedział ufności
Estymacja przedziałowa Przedział ufności Estymacja przedziałowa jest to szacowanie wartości danego parametru populacji, ρ za pomocą tak zwanego przedziału ufności. Przedziałem ufności nazywamy taki przedział
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
CYFROWE PRZETWARZANIE SYGNAŁÓW
POLITECHNIKA RZESZOWSKA im. I. Łukasiewicza WYDZIAŁ ELEKTROTECHNIKI I INFORMATYKI Katedra Metrologii i Systemów Diagnostycznych CYFROWE PRZETWARZANIE SYGNAŁÓW Sygnały stochastyczne, parametry w dziedzinie
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Stanisław Cichocki. Natalia Nehrebecka. Wykład 9
Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Estymacja parametrów w modelu normalnym
Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba
7.4 Automatyczne stawianie prognoz
szeregów czasowych za pomocą pakietu SPSS Następnie korzystamy z menu DANE WYBIERZ OBSERWACJE i wybieramy opcję WSZYSTKIE OBSERWACJE (wówczas wszystkie obserwacje są aktywne). Wreszcie wybieramy z menu
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
5 Błąd średniokwadratowy i obciążenie
5 Błąd średniokwadratowy i obciążenie Przeprowadziliśmy 200 powtórzeń przebiegu próbnika dla tego samego zestawu parametrów modelowych co w Rozdziale 1, to znaczy µ = 0, s = 10, v = 10, n i = 10 (i = 1,...,
b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:
ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań
Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania
Prognozowanie i Symulacje. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Szeregi czasowe 1 Szeregi czasowe 2 3 Szeregi czasowe Definicja 1 Szereg czasowy jest to proces stochastyczny z czasem dyskretnym
LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.
LABORATORIUM 4 1. Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. I) WNIOSKOWANIE STATYSTYCZNE (STATISTICAL INFERENCE) Populacja
Inteligentna analiza danych
Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi
Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska D syst D śr m 1 3 5 2 4 6 śr j D 1
Ważne rozkłady i twierdzenia c.d.
Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA
ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA Jan Mielniczuk Wisła, grudzień 2009 PLAN Błędy predykcji i ich podstawowe estymatory Estymacja błędu predykcji w modelu liniowym. Funkcje kryterialne Własności
Optymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
Ważne rozkłady i twierdzenia
Ważne rozkłady i twierdzenia Rozkład dwumianowy i wielomianowy Częstość. Prawo wielkich liczb Rozkład hipergeometryczny Rozkład Poissona Rozkład normalny i rozkład Gaussa Centralne twierdzenie graniczne
Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41
Statystyka Wykład 4 Magdalena Alama-Bućko 13 marca 2017 Magdalena Alama-Bućko Statystyka 13 marca 2017 1 / 41 Na poprzednim wykładzie omówiliśmy następujace miary rozproszenia: Wariancja - to średnia arytmetyczna
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Analiza niepewności pomiarów
Teoria pomiarów Analiza niepewności pomiarów Zagadnienia statystyki matematycznej Dr hab. inż. Paweł Majda www.pmajda.zut.edu.pl Podstawy statystyki matematycznej Histogram oraz wielobok liczebności zmiennej
Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa
Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący
Biostatystyka, # 3 /Weterynaria I/
Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl
Rozkłady statystyk z próby. Statystyka
Rozkłady statystyk z próby tatystyka Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających ten
PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH
PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH Dr Benedykt R. Jany I Pracownia Fizyczna Ochrona Środowiska grupa F1 Rodzaje Pomiarów Pomiar bezpośredni - bezpośrednio
FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS
FOLIA UNIVERSITATIS AGRICULTURAE STETINENSIS Folia Univ. Agric. Stetin. 007, Oeconomica 54 (47), 73 80 Mateusz GOC PROGNOZOWANIE ROZKŁADÓW LICZBY BEZROBOTNYCH WEDŁUG MIAST I POWIATÓW FORECASTING THE DISTRIBUTION
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach
w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817
Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres
WYKŁAD 8 ANALIZA REGRESJI
WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych
STATYSTYKA MATEMATYCZNA WYKŁAD 3 Populacje i próby danych POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące
Analiza autokorelacji
Analiza autokorelacji Oblicza się wartości współczynników korelacji między y t oraz y t-i (dla i=1,2,...,k), czyli współczynniki autokorelacji różnych rzędów. Bada się statystyczną istotność tych współczynników.
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera
Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)
Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Przygotował: Dr inż. Wojciech Artichowicz Katedra Hydrotechniki PG Zima 2014/15 1 TABLICE ROZKŁADÓW... 3 ROZKŁAD
Grupowanie materiału statystycznego
Grupowanie materiału statystycznego Materiał liczbowy, otrzymany w wyniku przeprowadzonej obserwacji statystycznej lub pomiaru, należy odpowiednio usystematyzować i pogrupować. Doskonale nadają się do
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
Statystyka matematyczna
Statystyka matematyczna Wykład 8 Magdalena Alama-Bućko 7 maja 2018 Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 1 / 19 Przypomnijmy najpierw omówione na poprzednim wykładzie postaci przedziałów