Ocena niepewności rozwiązania w modelowaniu zmienności przestrzennej parametrów ośrodka za pomocą metody kosymulacji

Podobne dokumenty
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Zmienność wiatru w okresie wieloletnim

STATYSTYKA MATEMATYCZNA

Weryfikacja hipotez statystycznych

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

METODY STATYSTYCZNE W BIOLOGII

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

KURS STATYSTYKA. Lekcja 2 Przedziały ufności i estymacja przedziałowa ZADANIE DOMOWE. Strona 1

INFOBAZY 2014 VII KRAJOWA KONFERENCJA NAUKOWA INSPIRACJA - INTEGRACJA - IMPLEMENTACJA

Rozdział 8. Regresja. Definiowanie modelu

LABORATORIUM Z FIZYKI

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec

Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych. Wykład tutora na bazie wykładu prof. Marka Stankiewicza

Wnioskowanie statystyczne. Statystyka w 5

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Metody probabilistyczne

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

Analiza i monitoring środowiska

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Testowanie hipotez statystycznych.

Pobieranie prób i rozkład z próby

Testowanie hipotez statystycznych

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Wprowadzenie do analizy korelacji i regresji

Rozkłady statystyk z próby

Estymacja parametrów rozkładu cechy

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Prawdopodobieństwo i rozkład normalny cd.

Własności statystyczne regresji liniowej. Wykład 4

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

WYKŁAD 5 TEORIA ESTYMACJI II

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych. Wykład tutora na bazie wykładu prof. Marka Stankiewicza

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!

Testowanie hipotez statystycznych.

Sposoby opisu i modelowania zakłóceń kanałowych

PDF created with FinePrint pdffactory Pro trial version

Wykład 9 Wnioskowanie o średnich

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Statystyka matematyczna dla leśników

Statystyka w analizie i planowaniu eksperymentu

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Zadanie Cyfryzacja grida i analiza geometrii stropu pułapki w kontekście geologicznym

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Statystyczne Metody Opracowania Wyników Pomiarów

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Kontekstowe wskaźniki efektywności nauczania - warsztaty

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

PRZEWODNIK PO PRZEDMIOCIE

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Statystyka w przykładach

Etapy modelowania ekonometrycznego

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

ZS 14 Rok szkolny 2013/2014

Statystyka w analizie i planowaniu eksperymentu

MODELOWANIE POŁĄCZEŃ TYPU SWORZEŃ OTWÓR ZA POMOCĄ MES BEZ UŻYCIA ANALIZY KONTAKTOWEJ

Wnioskowanie bayesowskie

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Analiza danych. TEMATYKA PRZEDMIOTU

Instytut Fizyki Politechniki Łódzkiej Laboratorium Metod Analizy Danych Doświadczalnych Ćwiczenie 3 Generator liczb losowych o rozkładzie Rayleigha.

Inteligentna analiza danych

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Zachowania odbiorców. Grupa taryfowa G

WNIOSKOWANIE STATYSTYCZNE

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Automatyka i pomiary wielkości fizykochemicznych. Instrukcja do ćwiczenia III. Pomiar natężenia przepływu za pomocą sondy poboru ciśnienia

Analiza niepewności pomiarów

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Załącznik 1.1. Lokalizacja punktów pomiaru miąższości wybranych pokładów węgla w KWK Murcki (opróbowanie wiertnicze i górnicze)

WARSZTATY. Geostatystyka

Transkrypt:

NAFTA-GAZ grudzień 2012 ROK LXVIII Karolina Pirowska Instytut Nafty i Gazu, Kraków Ocena niepewności rozwiązania w modelowaniu zmienności przestrzennej parametrów ośrodka za pomocą metody kosymulacji Wstęp Ważnym aspektem stosowania narzędzi estymacji czy symulacji geostatystycznej do szacowania parametrów ośrodka geologicznego jest potrzeba omówienia, oceny i modelowania niepewności otrzymanych wyników. Już na początku trzeba wyszczególnić niepewność związaną z danymi. W pracy z danymi geologicznymi, geofizycznymi czy sejsmicznymi niedokładność spowodowana jest tym, że zwykle posiadamy ograniczoną wiedzę o bardzo skomplikowanej strukturze ośrodka. Surowe dane muszą być przetworzone lub interpretowane, pojawiają się założenia o modelach, decyzje podczas interpretacji itp. Pojawia się także niepewność związana z modelem często dane nie są bezpośrednim wynikiem pomiarów, mogą istnieć alternatywne interpretacje, różne geologiczne scenariusze. Ocena niepewności staje się bardzo subiektywnym zadaniem. Każda ocena niepewności powinna być przeprowadzona w oparciu o założony model. W rezultacie można wskazać jedynie pewien model niepewności i nigdy nie ma gwarancji, czy jest on najlepszy. Dlatego ocena niepewności jest jednym z najtrudniejszych i często kontrowersyjnych zagadnień w przemyśle nafty i gazu. Niestety precyzyjne i solidne oszacowanie niepewności jest konieczne w podejmowaniu decyzji [1]. Ogólnie w statystyce przyjmuje się, że prawdziwa wartość zmiennej losowej jest z 68% pewnością równa średniej wartości, plus/minus odchylenie standardowe. W przedziale dwukrotnie większym od odchylenia standardowego mieści się już 95,5% wartości danego parametru. Intuicyjnie wiadomo, że obszary, gdzie próbki są gęsto rozmieszczone, są obarczone mniejszą niepewnością, natomiast z obszarami, gdzie próbki są rzadko rozmieszczone, wiąże się większa wątpliwość. Jednak w przypadku metod geostatystycznych, jak kriging czy symulacja, gdzie mamy do czynienia z funkcjami losowymi czy zmiennymi losowymi wielowymiarowymi, taka prosta ocena staje się niewystarczająca. Potrzebne są narzędzia oceny poprawności przyjętych rozkładów, wariogramów, parametrów estymacji i symulacji. Dużym problemem jest fakt, że przestrzenna zmienność wielu systemów na ziemi nie jest dobrze opisana za pomocą wariogramu, tzn. bardzo różne wzory (rozkłady wartości parametru) mogą mieć taki sam wariogram. W przypadku symulacji użytkownik zmuszony jest do zmierzenia sie z niepewnością reprezentowaną przez wiele wygenerowanych realizacji. Ocena niepewności może zostać przeprowadzona w oparciu o obliczenie następujących rozkładów (map) [2]: rozkład wartości średniej estymacja typu E (z ang. expected value) średnia z wszystkich realizacji liczona punkt po punkcie, rozkład wariancji wariancja z rozkładu warunkowego, rozkład prawdopodobieństwa prawdopodobieństwo przekroczenia ustalonego progu, średniej wartości powyżej lub poniżej tego progu, wartość, przy której ustalona wartość p skumulowanego rozkładu warunkowego jest osiągnięta (warunkowa wartość kwantyla p). Komentarza wymagają dwa pierwsze rozkłady, które mogą bardzo przypominać wyniki krigingu mapę wartości danego parametru estymowanych krigingiem, wraz z wariancją krigingu. Rzeczywiście kriging dostarcza 1050

artykuły szybszej i bezpośredniej estymacji mapy podobnej do mapy typu E, ale nieidentycznej i nie ma możliwości policzenia innych typów oszacowania. Natomiast wariancja krigingu nie jest miarą dokładności estymatora, jakim jest kriging, ponieważ wariancja nie zależy od wartości danych, a jedynie od przestrzennej konfiguracji zbioru danych i przyjętego modelu kowariancji. Znacznie lepszą miarą potencjalnego błędu związanego z estymacją krigingiem może być warunkowa wariancja błędu obliczona na podstawie L realizacji (L oznacza liczbę realizacji) [4]. Modelowanie porowatości za pomocą metody kosymulacji sekwencyjnej Gaussa Do obliczeń wykorzystane zostały dane syntetyczne dostępne wraz z oprogramowaniem SGeMS w projekcie Stanford6.prj. Z projektu wyeksportowano dane otworowe (well_sample), a następnie zaimportowano je do nowego projektu. Dane syntetyczne składają się z 46 otworów, rozprzestrzenionych na obszarze 150 na 200 [jednostek, np. metry]. W każdym otworze dane są: impedancja akustyczna, prędkość v p, gęstość, facja, porowatość i przepuszczalność (po 80 próbek). Na rysunku 1 przedstawiono otwory wraz z wartościami porowatości w każdym z otworów. wydobyciem surowców czy przemysłem paliwowym. W oprogramowaniu Sgems dostępna jest m. in. procedura kosymulacji sekwencyjnej Gaussa o nazwie COSGSIM, której wyniki zaprezentowano w niniejszej publikacji, oraz procedura POSTSIM, której użyto do analizy niepewności rozwiązania. Metoda kosymulacji sekwencyjnej Gaussa należy do zbioru technik statystycznych, opartych o teorię funkcji losowych, uwzględniających w analizie danych ich lokalizację przestrzenną i czasową. Za pomocą metod symu- Rys. 1. Wykorzystane do obliczeń dane syntetyczne Wymienione oprogramowanie SGeMS The Stanford Geostatistical Modeling Software [3] jest pakietem programów (z dostępem do kodów źródłowych) umożliwiającym zastosowanie metod geostatystycznych. Oprogramowanie zostało stworzone w oparciu o istniejącą wcześniej, ogólnodostępną bibliotekę geostatystyczną GSlib [2]. Pakiet dostarcza narzędzi, z którego mogą korzystać studenci i naukowcy z dziedziny nauk o ziemi, jak i praktycy zajmujący się zagadnieniami związanymi ze środowiskiem, lacji możliwa jest identyfikacja i modelowanie struktury przestrzennej lub czasowej danego zjawiska lub obiektu, przedstawienie alternatywnych rozwiązań. W odróżnieniu od symulacji kosymulacja bazuje nie tylko na zmiennej głównej, której wartość znamy zazwyczaj w niewielu punktach, a chcemy oszacować na całym obszarze, ale również potrzebna jest zmienna dodatkowa, która pozostaje w relacji ze zmienną główną i która jest znacznie gęściej opróbkowana. 1051

NAFTA-GAZ Obiektem zainteresowania była estymacja porowatości, natomiast parametrem dodatkowym, na którym opierały się obliczenia, była impedancja akustyczna. Obliczenia przeprowadzono, korzystając z danych dotyczących porowatości pochodzących z 30 otworów, natomiast 16 kolejnych traktowano jako dane weryfikujące. Zmienna dodatkowa znana była we wszystkich 46 otworach. Przeprowadzono kosymulację w wersji pełnego kokrigingu. Na rysunku 2 przedstawiono dwie przykładowe realizacje. Rys. 2. Przykładowe realizacje wraz z poszukiwanymi wartościami porowatości z otworu testowego nr 9. Widać, że oszacowane w wyniku kosymulacji z pełnym kokrigingiem wartości porowatości dobrze przybliżają wartości testowe (nieco gorsze przybliżenie na dużych głębokościach). Poszczególne realizacje różnią się od siebie. Skala wartości porowatości rozciąga się od 0,022 (kolor niebieski) do 0,332 (kolor czerwony). Przykład oszacowania niepewności wyniku kosymulacji sekwencyjnej Gaussa Analizę niepewności rozwiązania przeprowadzono w oparciu o program POSTSIM. Za jego pomocą można dla wszystkich realizacji obliczyć średnią wartość porowatości dla danego punktu oraz wariancję warunkową (rysunek 3). Rys. 3. Mapa średnich wartości porowatości [rysunek a po lewej stronie, skala wartości porowatości średniej wynosi od 0,0266 (kolor niebieski) do 0,3311 (kolor czerwony)] oraz mapa wariancji warunkowej [rysunek b po prawej stronie, skala od 0,0003 (kolor niebieski) do 0,0175 (kolor czerwony)] obliczone dla wszystkich realizacji. Średnie wartości porowatości w pobliżu otworu testowego dobrze przybliżają wartości testowe, wariancja warunkowa jest mała dla fragmentów, gdzie wartość porowatości przyjmuje wysokie wartości, wariancja wzrasta w miejscach, gdzie wartość porowatości przyjmuje niskie wartości. 1052

artykuły Innymi pomocnymi rozkładami mogą być rozkłady prawdopodobieństwa (rysunek 4), które wskazują prawdopodobieństwo, że porowatość ma wartość mniejszą od zadanego progu, rozkłady dla wybranych kwantyli (rysunek 5) czy rozkłady powstałe po odcięciu punktów, w których porowatość przewyższa zadany próg. Do analizy posłużono się wynikami kosymulacji w lokalizacji jednego z otworów testowych otworu testowego nr 9. Analizując wykresy kwantyli rzędu 0,1; 0,2;...; 0,9, można wskazać fragmenty, gdzie uzyskuje się niemalże pewność, że porowatość będzie miała wartość z przedziału [0,25; 0,3] (próbki nr 52-68) oraz fragmenty, gdzie można mieć 70% pewności, że porowatość będzie miała wartość z przedziału [0,047; 0,11] (próbki nr 27-40). c) Rys. 4. Mapy prawdopodobieństwa. Kolorem niebieskim zaznaczone są obszary, gdzie prawdopodobieństwo jest bliskie 0, kolorem czerwonym prawdopodobieństwo jest bliskie 1. Porównanie z wartościami testowymi pozwala stwierdzić, że mapy prawdopodobieństw dobrze odzwierciedlają rzeczywistość. Rysunek a mapa prawdopodobieństwa, że wartość porowatości będzie niższa od 0,07. Prawdopodobieństwo jest wysokie we fragmentach, gdzie wartość porowatości jest niska. Natomiast we fragmentach, gdzie wartość porowatości jest wysoka, prawdopodobieństwo jest bliskie 0. Rysunek b mapa prawdopodobieństwa, że wartość porowatości będzie niższa od 0,17. Mapa niewiele różni się od wcześniejszej obszary niskiego, wysokiego prawdopodobieństwa nieco powiększają się. Rysunek c mapa prawdopodobieństwa, że wartość porowatości będzie niższa od 0,27. Zgodnie z wartościami testowymi fragmentom, gdzie porowatość ma bardzo dużą wartość, zostało przyporządkowane prawdopodobieństwo bliskie 0. c) Rys. 5. Mapy kwantyli. Rysunek a rozkład kwantyla rzędu 0,25 dla wartości porowatości. Rysunek b rozkład kwantyla rzędu 0,5 dla wartości porowatości. Rysunek c rozkład kwantyla rzędu 0,75 dla wartości porowatości. Skala tak ja dla wartości porowatości wynosi od 0,022 (kolor niebieski) do 0,331 (kolor czerwony). 1053

NAFTA-GAZ Rys. 6. Zbiorczy wykres kwantyli (rzędu 0,1; 0,2;...; 0,9) dla otworu testowego nr 9 wraz z poszukiwaną wartością porowatości Podsumowanie Ocena niepewności rozwiązania powinna być zawsze dołączona do wyniku przeprowadzonych symulacji. Jest to jedno z trudniejszych zadań przy zastosowaniu metod symulacji. Dużymi błędami i niedokładnością mogą być obarczone już na wstępie dane wejściowe. Niepewność rozwiązania mogą również zwiększać nieprawidłowo dobrane wariogramy modelowe i parametry symulacji czy kosymulacji. Przy analizie i ocenie realizacji pomocne jest obliczenie wartości średniej, wariancji warunkowej, rozkładów prawdopodobieństwa, rozkładów kwantyli czy map odcięcia. Najbardziej przemawiająca, według autorki, wydaje się być analiza map kwantyli. W literaturze, na której bazowano w niniejszej pracy, nie spotkano się z tego typu szczegółową analizą. Porównując wartości kwantyli poszczególnych rzędów, można wskazać w dowolnym punkcie obszaru przedziały koncentracji wartości porowatości (obliczone na podstawie wszystkich realizacji). W przeprowadzonych obliczeniach udało się uzyskać do 60 70% pewności, że porowatość należy do danego przedziału wartości. Trzeba jednak pamiętać, że nawet tak wysokie prawdopodobieństwo nie daje gwarancji i może się zdarzyć, że prawdziwa wartość będzie spoza przedziału. W mocy pozostaje zasada, że im lepszymi danymi dysponujemy, tym pewniejsze i solidniejsze są wyniki symulacji czy kosymulacji. Niestety w praktyce trudno o pozbawione błędów, równomiernie rozprzestrzenione dane, a najlepiej jeśli posiadamy jeszcze dodatkowe dane, które można włączyć do obliczeń. Być może należy tu upatrywać przyczyny tego, że na gruncie polskim potencjał geostatystycznych metod symulacji czy kosymulacji wciąż jeszcze pozostaje niedoceniony i słabo wykorzystany. Literatura [1] Caers J.: Petroleum Geostatistics. Society of Petroleum Engineers 2005. [2] Deutsch C. V., Journel A.: GSLIB Geostatistical Software Library and User s Giude. Oxford University Press 1998. [3] http://sgems.sourceforge.net strona oprogramowania SGems. [4] Remy N., Boucher A., Wu J.: Applied Geostatistics with SGeMS. Cambridge University Press 2009. [5] Remy N.: Geostatistical Earth Modeling Software: User s Manual, 2004. Mgr Karolina PIROWSKA absolwentka kierunku Matematyka na Uniwersytecie Jagiellońskim, specjalizacja: Zastosowania Matematyki. Od lutego 2007 roku pracownik Zakładu Sejsmiki Instytutu Nafty i Gazu w Krakowie. Zajmuje się zastosowaniem metod optymalizacji stochastycznej w rozwiązaniu odwrotnego zadania kinematycznego w metodzie sejsmicznej. 1054