Redukcja wariancji w metodach Monte-Carlo

Podobne dokumenty
1 Wykład 4. Proste Prawa wielkich liczb, CTG i metody Monte Carlo

Komputerowa Analiza Danych Doświadczalnych

Biostatystyka, # 3 /Weterynaria I/

Metoda Monte Carlo. Jerzy Mycielski. grudzien Jerzy Mycielski () Metoda Monte Carlo grudzien / 10

Prawdopodobieństwo i statystyka

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Statystyka i eksploracja danych

Weryfikacja hipotez statystycznych

Prawdopodobieństwo i statystyka r.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Ważne rozkłady i twierdzenia c.d.

Matematyka ubezpieczeń majątkowych r.

Funkcje charakterystyczne zmiennych losowych, linie regresji 1-go i 2-go rodzaju

Pobieranie prób i rozkład z próby

Całki nieoznaczone. 1 Własności. 2 Wzory podstawowe. Adam Gregosiewicz 27 maja a) Jeżeli F (x) = f(x), to f(x)dx = F (x) + C,

Całkowanie metodą Monte Carlo

WYKŁAD 8 ANALIZA REGRESJI

Informacja o przestrzeniach Sobolewa

Oznacza to, że chcemy znaleźć minimum, a właściwie wartość najmniejszą funkcji

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Prawdopodobieństwo i statystyka

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

KADD Minimalizacja funkcji

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

Metody Obliczeniowe w Nauce i Technice

Dystrybucje, wiadomości wstępne (I)

Wykłady ostatnie. Rodzinę P podzbiorów przestrzeni X nazywamy σ - algebrą, jeżeli dla A, B P (2) A B P, (3) A \ B P,

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Statystyka i eksploracja danych

Wykłady... b i a i. i=1. m(d k ) inf

Wstęp do Rachunku Prawdopodobieństwa, IIr. WMS

Zawansowane modele wyborów dyskretnych

Maciej Grzesiak Instytut Matematyki Politechniki Poznańskiej. Całki nieoznaczone

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Metoda największej wiarogodności

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Metoda reprezentacyjna

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

PDF created with FinePrint pdffactory Pro trial version

Całka podwójna po prostokącie

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Dystrybucje. Marcin Orchel. 1 Wstęp Dystrybucje Pochodna dystrybucyjna Przestrzenie... 5

Prawdopodobieństwo i statystyka

Procesy stochastyczne

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Prawdopodobieństwo i statystyka

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka r.

P (A B) = P (A), P (B) = P (A), skąd P (A B) = P (A) P (B). P (A)

Zadania do Rozdziału X

Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/

Rozkłady statystyk z próby

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Ważne rozkłady i twierdzenia

II. RÓŻNICZKOWANIE I CAŁKOWANIE NUMERYCZNE Janusz Adamowski

Metoda największej wiarygodności

Procesy stochastyczne

Metody probabilistyczne

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Parametr Λ w populacji ubezpieczonych ma rozkład dany na półosi dodatniej gęstością: 3 f

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów

VI. Równania różniczkowe liniowe wyższych rzędów

Lista 6. Kamil Matuszewski 13 kwietnia D n =

Wykład 3 Momenty zmiennych losowych.

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Wykład 3 Momenty zmiennych losowych.

1 Relacje i odwzorowania

Algorytm Metropolisa-Hastingsa

G. Plebanek, MIARA I CAŁKA Zadania do rozdziału 1 28

Komputerowa analiza danych doświadczalnych

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Matematyka II. Bezpieczeństwo jądrowe i ochrona radiologiczna Semestr letni 2018/2019 wykład 13 (27 maja)

Zadania z Rachunku Prawdopodobieństwa III - 1

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

KADD Minimalizacja funkcji

Interpolacja, aproksymacja całkowanie. Interpolacja Krzywa przechodzi przez punkty kontrolne

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Metody statystyczne kontroli jakości i niezawodności Lekcja II: Karty kontrolne.

WYKŁAD 5 TEORIA ESTYMACJI II

F t+ := s>t. F s = F t.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Średnie. Średnie. Kinga Kolczyńska - Przybycień

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Układy równań i równania wyższych rzędów

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

Zaawansowane metody numeryczne

Metody probabilistyczne

Transkrypt:

14.02.2006 Seminarium szkoleniowe 14 lutego 2006

Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna

Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna

Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna

Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna

Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna

Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna

Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna

Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna

Wprowadzenie 14.02.2006 Seminarium szkoleniowe Zadanie: Policzyć całkę zapisaną jako iloczyn funkcji o następującej postaci: E f h (X ) = h (x) f (x) dx, (1) gdzie f (x) jest gęstością pewnego rozkładu prawdopodobieństwa o nośniku χ. Oszacowanie metodą MC: Generujemy próbę X 1,..., X m zmiennych i.i.d. z rozkładu o gęstości f (x). Wówczas χ h f (X ) = 1 m m h (X j ) (2) j=1 przybliża, zgodnie z prawem wielkich liczb, wartość oczekiwaną E f h (X ).

Wprowadzenie 14.02.2006 Seminarium szkoleniowe Zadanie: Policzyć całkę zapisaną jako iloczyn funkcji o następującej postaci: E f h (X ) = h (x) f (x) dx, (1) gdzie f (x) jest gęstością pewnego rozkładu prawdopodobieństwa o nośniku χ. Oszacowanie metodą MC: Generujemy próbę X 1,..., X m zmiennych i.i.d. z rozkładu o gęstości f (x). Wówczas χ h f (X ) = 1 m m h (X j ) (2) j=1 przybliża, zgodnie z prawem wielkich liczb, wartość oczekiwaną E f h (X ).

Przykład Policzyć całkę gdzie I = 1 0 h (x) dx, h (x) = 0 dla x < 0 1 dla 0 x < 1 2 2 dla 1 2 x < 1 0 dla x 1

Rozwiązanie metodą MC [ ) [ ) Losujemy punkty równomiernie z przedziału 0, 1 2, 1 2, 1. Niech H 1 = H 2 = 1/2 0 1 1/2 h (x) dx (3) h (x) dx. (4) Wówczas I = H 1 + H 2. Całkę (3) zapiszemy w postaci: H 1 = 1 2 1 0 h (x) dp 1 gdzie P 1 jest rozkładem równomiernym na przedziale [ ) 0, 1 2.

Losując punkty równomiernie otrzymujemy: σ 2 H 1 = 1 0 ( ) h (x) 2 ( 1 dp 1 2 0 ) h (x) 2 2 dp 1 = 0. Analogicznie wariancja σ 2 H 2 estymatora drugiej całki jest zerem. Wnioski Dla bezbłędnego oszacowania całki funkcji stałej wystarczy znajomość wartości tej funkcji w jednym punkcie przedziału całkowania. W ten sposób udało się zredukować wariancję estymatora całki I do zera.

Metoda losowania warstwowego 14.02.2006 Seminarium szkoleniowe Rozpatrujemy zadanie obliczenia całki I =... f (x 1,.x 2,..., x n ) dx 1 dx 2...dx n = Ω Ω fdx. Dzielimy Ω na rozłączne podzbiory Ω j,j = 1, 2,..., k i zapisujemy całkę I w postaci sumy całek: k I = I (j) j=1 gdzie I (j) = fdx. Ω j

Ω j miara (objętość) n wymiarowej warstwy Ω j. P j rozkład równomierny na Ω j, tzn.: P j = dx Ω j Wówczas: I (j) = Ω j fdp j. Ω j Î (j) = Ω j n j n j f (x ij ) gdzie x ij jest i tym punktem wylosowanym w j tej warstwie Ω j według rozkładu prawdopodobieństwa P j na tej warstwie. Losowanie w poszczególnych warstwach jest niezależne! i=1

Oszacowanie całki I k Î 3 = Î (j). (5) i=1 Właściwości estymatora Î3 Î3 jest nieobciążonym estymatorem całki I. Wariancja Î3 wynosi: σ 2 (Î3 ) k = i=1 Ω j σj 2 n j gdzie σ 2 j jest wariancją funkcji f na j tej warstwie: σj 2 = f 2 dp j Ej 2, E j = Ω j fdp j Ω j

Jeżeli σj 2 jest nieznane, to szacuje się je na podstawie wylosowanych punktów za pomocą wariancji sj 2 : gdzie s 2 j = 1 n j 1 n j ] 2 [f (x ij ) f j i=1 n j f j = 1 f (x ij ) n j i=1 jest wartością średnią funkcji f w punktach wylosowanych z j tej warstwy. Oszacowanie wariancji σ 2 (Î3 ) s 2 (Î3 ) k = i=1 Ω j 2 n j 1 { 1 n j n j } f 2 (x ij ) f 2 j. i=1

Losując N = n 1 + n 2 +... + n k punktów, chcemy tak dokonać podziału Ω na warstwy oraz tak ustalić liczby n 1, n 2,..., n k aby wariancja estymatora Î3 była najmniejsza. Zagadnienie to zwane jest w statystyce zagadnieniem optymalnej lokalizacji próby. Optymalny dobór warstw oraz liczb n 1, n 2,..., n k zależy oczywiście od funkcji f i obszaru całkowania Ω. Jednak przyjmując najbardziej uniwersalne metody doboru Ω j oraz n j można uzyskać znaczną redukcję wariancji estymatora Î3 w stosunku do wariancji estymatora wyznaczonego metodą podstawową.

Najprostszy przypadek Ω podzielono na jednakowo duże warstwy: Ω 1 = Ω 2 =... = Ω k = Ω /k. Z każdej warstwy losuje się jednakową liczbę punktów: otrzymujemy: n 1 = n 2 =... = n k = N/k = m σ 2 (Î31 Î 31 = Ω N ) = Ω 2 kn k j=1 i=1 k j=1 m f (x ij ) σ 2 j.

Niech E będzie średnią wartością funkcji f na Ω. W metodzie podstawowej mamy: Î 2 = Ω N N f (x i ) i=1 Można wykazać, że: σ 2 (Î2 ) = Ω 2 N σ2 f. σ 2 (Î2 ) = Ω 2 kn k j=1 Ωj σ 2j + Ω 2 N k j=1 Ω j (E j E) 2 dp σ 2 (Î31 ).

Wnioski Wariancja nawet najprostszego estymatora Î31 nigdy nie jest większa od σ 2 {Î2} uzyskanego metodą podstawową. Stosując losowanie warstwowe zmniejszamy wariancję o wielkość Ω 2 kj=1 N (E j E) 2 dp, która jest równa zeru wtedy i tylko wtedy, gdy dla każdego j mamy (E j E) 2 dp = 0. Ω j Korzyść z zastosowania losowania warstwowego jest tym większa, im bardziej wartości średnie E j funkcji na poszczególnych warstwach będą różniły się między sobą.

Wnioski Wariancja nawet najprostszego estymatora Î31 nigdy nie jest większa od σ 2 {Î2} uzyskanego metodą podstawową. Stosując losowanie warstwowe zmniejszamy wariancję o wielkość Ω 2 kj=1 N (E j E) 2 dp, która jest równa zeru wtedy i tylko wtedy, gdy dla każdego j mamy (E j E) 2 dp = 0. Ω j Korzyść z zastosowania losowania warstwowego jest tym większa, im bardziej wartości średnie E j funkcji na poszczególnych warstwach będą różniły się między sobą.

Wnioski Wariancja nawet najprostszego estymatora Î31 nigdy nie jest większa od σ 2 {Î2} uzyskanego metodą podstawową. Stosując losowanie warstwowe zmniejszamy wariancję o wielkość Ω 2 kj=1 N (E j E) 2 dp, która jest równa zeru wtedy i tylko wtedy, gdy dla każdego j mamy (E j E) 2 dp = 0. Ω j Korzyść z zastosowania losowania warstwowego jest tym większa, im bardziej wartości średnie E j funkcji na poszczególnych warstwach będą różniły się między sobą.

Metoda średniej ważonej Policzyć całkę I = b Niech g będzie taką funkcją, że: a f (x) dx. (6) g (x) > 0 dla a x b, oraz b a g (x) dx = 1. Funkcję g można traktować jako gęstość pewnej zmiennej losowej. Wówczasz całkę (6) można zapisać w postaci: I = b gdzie dp = g (x) dx. a f (x) b g (x) g (x) dx lub I = f (x) g (x) dp a

Algorytm Wylosować na przedziale (a, b) punkt x i zgodnie z rozkładem prawdopodobieństwa P Obliczyć wartość f (x i ) /g (x i ) funkcji podcałkowej w tym punkcie Powtórzyć obliczenia dla i = 1, 2,..., N i obliczyć wartość średnią 1 N f (x i ) /g (x i ). (7) N i=1 Wielkość (7) przyjąć jako oszacowanie całki I

Algorytm Wylosować na przedziale (a, b) punkt x i zgodnie z rozkładem prawdopodobieństwa P Obliczyć wartość f (x i ) /g (x i ) funkcji podcałkowej w tym punkcie Powtórzyć obliczenia dla i = 1, 2,..., N i obliczyć wartość średnią 1 N f (x i ) /g (x i ). (7) N i=1 Wielkość (7) przyjąć jako oszacowanie całki I

Algorytm Wylosować na przedziale (a, b) punkt x i zgodnie z rozkładem prawdopodobieństwa P Obliczyć wartość f (x i ) /g (x i ) funkcji podcałkowej w tym punkcie Powtórzyć obliczenia dla i = 1, 2,..., N i obliczyć wartość średnią 1 N f (x i ) /g (x i ). (7) N i=1 Wielkość (7) przyjąć jako oszacowanie całki I

Algorytm Wylosować na przedziale (a, b) punkt x i zgodnie z rozkładem prawdopodobieństwa P Obliczyć wartość f (x i ) /g (x i ) funkcji podcałkowej w tym punkcie Powtórzyć obliczenia dla i = 1, 2,..., N i obliczyć wartość średnią 1 N f (x i ) /g (x i ). (7) N i=1 Wielkość (7) przyjąć jako oszacowanie całki I

Problem Dobór funkcji g tak, aby wariancja σf 2 /g = b a była jak najmniejsza. ( ) f (x) 2 g(x) g (x) dx I 2 Najbardziej ogólne rozwiązanie Wybrać funkcję g w taki sposób, aby f /g była jak najbardziej stała na całym obszarze całkowania (a, b). Funkcja g powinna więc jakoś naśladować f. Uwaga Jeżeli funkcja g jest zbyt skomplikowana, to wygenerowanie liczb losowych o gęstości g będzie trudne.

Zagadnienie doboru wag Można wykazać, że: ( b 2 ( b 2 σf 2 /g f (x) dx) f (x) dx). a a Najmnieszają możliwą wariancją do uzyskania jest zatem ( b 2 ( b 2 σ0 2 = f (x) dx) f (x) dx). a a Taką wariancję uzyskuje się wtedy, gdy g (x) = λ f (x), gdzie λ jest dowolną stałą.

Jeżeli funkcja f jest nieujemna na przedziale całkowania, to uzyskamy σ0 2 = 0 wtedy, gdy waga g (x) = λf (x). Stała musi być wyznaczona z warunku b a g (x) dx = 1, czyli: λ = b a 1. f (x) dx UWAGA Chociaż teoretycznie wariancja estymatora f (X ) /g (X ) może być zredukowana do zera, jednak praktycznie jest to niemożliwe, ponieważ do skonstruowania takiej wagi potrzebna jest stała λ, której znajomość jest równoważna znajomości wartości obliczanej całki!

W przypadku bardziej skomplikowanych funkcji podcałkowych oraz bardziej skomplikowanych obszarów całkowania wybór wag g nie jest sprawą łatwą. Możliwe rozwiązania problemu Konstrukcja wag przez aproksymację wielomianami Bernsteina Metoda adaptacyjna Metoda sekwencyjna

W przypadku bardziej skomplikowanych funkcji podcałkowych oraz bardziej skomplikowanych obszarów całkowania wybór wag g nie jest sprawą łatwą. Możliwe rozwiązania problemu Konstrukcja wag przez aproksymację wielomianami Bernsteina Metoda adaptacyjna Metoda sekwencyjna

W przypadku bardziej skomplikowanych funkcji podcałkowych oraz bardziej skomplikowanych obszarów całkowania wybór wag g nie jest sprawą łatwą. Możliwe rozwiązania problemu Konstrukcja wag przez aproksymację wielomianami Bernsteina Metoda adaptacyjna Metoda sekwencyjna

Metoda adaptacyjna doboru wag 1. Początkowo wybieramy dowolną wagę g 0. 2. Losujemy według tego rozkładu n 0 punktów. 3. Korzystając z wyników dotychczasowych obliczeń wybieramy nową lepszą wagę g 1. 4. Analogicznie wybiera się następne wagi g 2, g 3,..., przy czym każda następna waga jest lepsza od poprzedniej w tym sensie, że: σ 2 f /g 0 σ 2 f /g 1...

Metoda adaptacyjna doboru wag 1. Początkowo wybieramy dowolną wagę g 0. 2. Losujemy według tego rozkładu n 0 punktów. 3. Korzystając z wyników dotychczasowych obliczeń wybieramy nową lepszą wagę g 1. 4. Analogicznie wybiera się następne wagi g 2, g 3,..., przy czym każda następna waga jest lepsza od poprzedniej w tym sensie, że: σ 2 f /g 0 σ 2 f /g 1...

Metoda adaptacyjna doboru wag 1. Początkowo wybieramy dowolną wagę g 0. 2. Losujemy według tego rozkładu n 0 punktów. 3. Korzystając z wyników dotychczasowych obliczeń wybieramy nową lepszą wagę g 1. 4. Analogicznie wybiera się następne wagi g 2, g 3,..., przy czym każda następna waga jest lepsza od poprzedniej w tym sensie, że: σ 2 f /g 0 σ 2 f /g 1...

Metoda adaptacyjna doboru wag 1. Początkowo wybieramy dowolną wagę g 0. 2. Losujemy według tego rozkładu n 0 punktów. 3. Korzystając z wyników dotychczasowych obliczeń wybieramy nową lepszą wagę g 1. 4. Analogicznie wybiera się następne wagi g 2, g 3,..., przy czym każda następna waga jest lepsza od poprzedniej w tym sensie, że: σ 2 f /g 0 σ 2 f /g 1...

Metoda adaptacyjna doboru wag jest szczególnie efektywna, jeżeli wagi g i wybiera się z pewnej rodziny rozkładów różniących się między sobą tylko wartościami parametrów. Niech: ( α (i) = α (i) ) 1, α(i) 2,..., α(i) m wektor parametrów wyznaczających g i. σ 2 ( α (i)) wariancja estymatora f (X ) /g i (X ). Zadanie Wyznacz taki punktu α (opt) w m wymiarowej przestrzeni parametrów rozkładów g i, dla którego wariancja σ 2 ( α (i)) osiąga minimum.

Metoda zmiennych kontrolnych Zaobserwowaliśmy już, że błąd oszacowania całki jest tym mniejszy im funkcja podcałkowa jest bardziej stała. Technika losowania warstwowego rozbija obszar całkowania na podobszary, w których funkcja f jest mniej zmienna. Technika średniej ważonej polega na takim doborze wag dla funkcji podcałkowej f, żeby iloraz f /g był funkcją możliwie stałą na obszarze całkowania. Technika zmiennych kontrolnych polega na doborze takiej funkcji g, żeby różnica (f g) była możliwie stała.

Metoda zmiennych kontrolnych Zaobserwowaliśmy już, że błąd oszacowania całki jest tym mniejszy im funkcja podcałkowa jest bardziej stała. Technika losowania warstwowego rozbija obszar całkowania na podobszary, w których funkcja f jest mniej zmienna. Technika średniej ważonej polega na takim doborze wag dla funkcji podcałkowej f, żeby iloraz f /g był funkcją możliwie stałą na obszarze całkowania. Technika zmiennych kontrolnych polega na doborze takiej funkcji g, żeby różnica (f g) była możliwie stała.

Metoda zmiennych kontrolnych Zaobserwowaliśmy już, że błąd oszacowania całki jest tym mniejszy im funkcja podcałkowa jest bardziej stała. Technika losowania warstwowego rozbija obszar całkowania na podobszary, w których funkcja f jest mniej zmienna. Technika średniej ważonej polega na takim doborze wag dla funkcji podcałkowej f, żeby iloraz f /g był funkcją możliwie stałą na obszarze całkowania. Technika zmiennych kontrolnych polega na doborze takiej funkcji g, żeby różnica (f g) była możliwie stała.

Obliczyć całkę I = b a f (x) dx = b a b [f (x) g (x)] dx + g (x) dx. a Jeżeli funkcja g będzie wybrana tak, aby b a g (x) dx mogła być dokładnie obliczona, to dla oszacowania Î = 1 N N [f (x i ) g (x i )] + γ i=1 gdzie γ = b a g (x) dx, otrzymamy wariancję (Î ) σ 2 = σf 2 g /N = 1 ( b ) b 2 [f (x) g (x)] 2 dx [f (x) g (x)] dx N a a

Powyższe zadanie sprowadza się do obliczenia całki b a [f (x) g (x)] dx. Najprostszy estymator: różnica f (X ) g (X ), gdzie X jest zmienną losową o rozkładzie równomiernym na przedziale (a, b). Wariancja estymatora f (X ) g (X ): σ 2 f g = σ 2 [f (X ) g (X )] = σ 2 [f (X )] + σ 2 [g (X )] 2cov [f (X ), g (X )] Jeżeli zmienne losowe są silnie dodatnio skorelowane, to ich kowariancja jest duża i dodatnia. Wówczas wariancja σ 2 f g jest mała.

Powyższe zadanie sprowadza się do obliczenia całki b a [f (x) g (x)] dx. Najprostszy estymator: różnica f (X ) g (X ), gdzie X jest zmienną losową o rozkładzie równomiernym na przedziale (a, b). Wariancja estymatora f (X ) g (X ): σ 2 f g = σ 2 [f (X ) g (X )] = σ 2 [f (X )] + σ 2 [g (X )] 2cov [f (X ), g (X )] Jeżeli zmienne losowe są silnie dodatnio skorelowane, to ich kowariancja jest duża i dodatnia. Wówczas wariancja σ 2 f g jest mała.

Powyższe zadanie sprowadza się do obliczenia całki b a [f (x) g (x)] dx. Najprostszy estymator: różnica f (X ) g (X ), gdzie X jest zmienną losową o rozkładzie równomiernym na przedziale (a, b). Wariancja estymatora f (X ) g (X ): σ 2 f g = σ 2 [f (X ) g (X )] = σ 2 [f (X )] + σ 2 [g (X )] 2cov [f (X ), g (X )] Jeżeli zmienne losowe są silnie dodatnio skorelowane, to ich kowariancja jest duża i dodatnia. Wówczas wariancja σ 2 f g jest mała.

Proponowana metoda będzie opłacalna wtedy, gdy ρ 1 1 l. gdzie ρ jest współczynnikiem korelacji zmiennych f i g notomiast l jest pewną stałą (jeżeli przyjmiemy, że obliczenie funkcji g jest równie pracochłonne jak obliczenie funkcji f to l = 2). Definicja zmiennej kontrolnej Zmienną losową g (X ) o takich własnościach, że współczynnik korelacji ρ pomiędzy zmiennymi f (X ) i g (X ) spełnia warunek ρ > 1 1 l całka b a g (x) dx jest znana nazywamy zmienną kontrolną dla f (X ).

Metoda zmiennych antytetycznych Przypuśćmy, że do obliczenia całki I = b a f (x) dx (8) dysponujemy dwoma estmatorami nieobciążonymi f 1 (ζ) oraz f 2 (η) gdzie ζ i η są pewnymi zmiennymi losowymi. Wówczas F 2 = 1 2 (f 1 + f 2 ) jest również estymatorem nieobciążonym całki (8). Wariancja estymatora F 2 σ 2 (F 2 ) = 1 4 σ2 (f 1 ) + 1 4 σ2 (f 2 ) + 1 2 cov (f 1, f 2 ).

Uogólnione na przypadek wielu estymatorów całki I Do obliczenia całki (8) dysponujemy m nieobciążonymi estymatorami f 1 (ζ 1 ), f 2 (ζ 2 ),..., f m (ζ m ), gdzie ζ 1, ζ 2,..., ζ m są pewnymi zmiennymi losowymi. Wówczas: F m (ζ 1, ζ 2,..., ζ m ) = 1 m (f 1 (ζ 1 ) + f 2 (ζ 2 ) +... + f m (ζ m )) jest również nieobciążonym estymatorem całki I, a jego wariancja σ 2 (F m ) = 1 m m 2 σ 2 (f i ) + 2 m 2 cov (f i, f j ) i=1 i<j Zadanie Wprowadzić takie zależności między zmiennymi ζ 1, ζ 2,..., ζ m aby wariancja σ 2 (F m ) była możliwie najmniejsza.

Przykłady najczęściej używanych estymatorów zbudowanych na koncepcji zmiennych antytetycznych 1) Zakładamy, że funkcja f w całce I = b a f (x) dx jest malejąca. Budujemy estymator: f 2 (ς) = 1 [f (ς) + f (1 ς)]. (9) 2

Niech gdzie I (2) = b a f 2 (x) dx f 2 (x) = 1 [f (x) + f (1 x)]. 2 Wówczas: I (2) = I f 2 jest bardziej stała na przedziale (a, b) niż funkcja f σ 2 {f 2 } σ 2 {f } całka I (2) = b a f 2 (x) dx w przypadku losowania tej samej liczby punktów będzie szacowała dokładniej niż całka I = b a f (x) dx.

2) Dla funkcji monotonicznej na przedziale (a, b) można skonstruować bardziej ogólny estymator I α f (X ) = αf (αx ) + (1 α) f [1 (1 α) X ]) (10) gdzie 0 < α < 1, X U (a, b). Niech σ 2 [I α f (X )] = V (α). Wówczas mamy V (α) = b a { } αf (αx) + (1 α) f [1 (1 α) x] 2 dx I 2 Problem Dobrać optymalne α, tak aby σ 2 [I α f (X )] osiągała minimum. Wariancja V (α) osiąga minimum gdy dv (α) /dα = 0. Komentarz Wyznaczenie optymalnej wartości α 0 może być zadaniem bardzo trudnym (nawet trudniejszym niż obliczenie całki I ).

Metoda regresji 14.02.2006 Seminarium szkoleniowe Przypuśćmy, że do obliczenia całki I = b a f (x) dx (11) dysponujemy m estymatorami nieobciążonym Î1,..., Îm. Wówczas estymator Î = a 1Î1 +... + a mîm gdzie a 1 +... + a m = 1, jest również) estymatorem nieobciążonym całki I. Wariancja estymatora σa (Î 2 zależy od odpowiedniego doboru współczynników a i. Zadanie ) Dobrać a 1,..., a m tak, aby σa (Î 2 była najmniejsza.

Niech V = (v ij ), gdzie (v ij ) = cov (Îi Îj), oznacza macierz kowariancji estymatorów I j. Wówczas: a i = 1 v m v ij j=1 gdzie v ij są elementami macierzy V 1, natomiast v suma wszystkich elementów macierzy V 1 : v = m i=1 j=1 Wariancja najlepszego estymatora m v ij. (Î ) σ 2 = 1 v.

Oszacowania kowariancji estymatorów Îj. v ij = 1 N 1 N ) (Îik (Îjk Îj.) Îi. k=1 gdzie Îik jest wartością estymatora Îi w k tym punkcie, k = 1,...N, oraz Îi. = 1 N N Îik k=1 Czasami wygodniejszy jest rachunkowo wzór: v ij = 1 N 1 N k=1 ÎikÎjk 1 ( N ) ( N ) N 1 Îik Îjk k=1 k=1

Uwagi końcowe Metody regresji daje się łatwo stosować przy obliczaniu całek wielokrotnych. Umiejętność skonstruowania kilku estymatorów nieobciążonych obliczanej całki, pozwala za pomocą regresji stworzyć taką liniową kombinację tych estymatorów, która prowadzi do estymatora nieobciążonego o minimalnej wariancji. Fakt, że skonstruowanie nieobciążonych estymatorów nie jest zbyt kłopotliwe, czyni tę metodę uniwersalną i wygodną.

Uwagi końcowe Metody regresji daje się łatwo stosować przy obliczaniu całek wielokrotnych. Umiejętność skonstruowania kilku estymatorów nieobciążonych obliczanej całki, pozwala za pomocą regresji stworzyć taką liniową kombinację tych estymatorów, która prowadzi do estymatora nieobciążonego o minimalnej wariancji. Fakt, że skonstruowanie nieobciążonych estymatorów nie jest zbyt kłopotliwe, czyni tę metodę uniwersalną i wygodną.

Uwagi końcowe Metody regresji daje się łatwo stosować przy obliczaniu całek wielokrotnych. Umiejętność skonstruowania kilku estymatorów nieobciążonych obliczanej całki, pozwala za pomocą regresji stworzyć taką liniową kombinację tych estymatorów, która prowadzi do estymatora nieobciążonego o minimalnej wariancji. Fakt, że skonstruowanie nieobciążonych estymatorów nie jest zbyt kłopotliwe, czyni tę metodę uniwersalną i wygodną.

Aproksymacja za pomocą wielomianów Bernsteina Rozważamy zagadnienie obliczenia całki I = 1 0 1... f (x 1,..., x n ) dx 1...dx n (12) 0 Całkę (12) zapisywać będziemy krótko w postaci I = J f (x) dx gdzie x = (x 1,..., x n ) natomiast J jest kostką jednostkową (0 x 1 1,..., 0 x n 1) w n wymiarowej przestrzeni liczb rzeczywistych.

Stosując metodę zmiennej kontrolnej z funkcją g zadanie obliczenia całki I = [f (x) g (x)] dx + g (x) dx J J sprowadza się do obliczenia metodą MC całki [f (x) g (x)] dx. J Jako funkcji kontrolnej g użyjemy teraz wielomianu Bernsteina funkcji f : B f m (x) = B f m 1,m 2,...,m n (x 1,..., x n ) = gdzie m 1 m 2 v 1 =0 v 2 =0 p q,r (x) =... m n v n=0 f ( v1, v 2,..., v ) n n m 1 m 2 m n k=1 ( ) r x q (1 x) r q, 0 q r. q p vk,m k (x k )

B f m (x) dobrze przybliża f B f m (x) przy m zbiega do funkcji f w każdym punkcie jej ciągłości. jeżeli istnieją wszystkie pochodne cząstkowe rzędu p funkcji f i pochodne te są ciągłe, to pochodne wielomianu B f m (x) są zbieżne do pochodnych funkcji f. Całka J Bf m (x) może być łatwo obliczona, ponieważ: B f m (x) = m 1 m 2... m n f ( v1, v 2,..., v ) n m 1 m 2 m n J v 1 =0 v 2 =0 v n=0 n 1 S p vk,m k (x k ) dx k = k=1 0 n k=1 gdzie S = m 1 m2 v 1 =0 v 2 =0... ( ) m n v f v1 n=0 m 1, v 2 m 2,..., vn m n. (13) (m k + 1)

B f m (x) dobrze przybliża f B f m (x) przy m zbiega do funkcji f w każdym punkcie jej ciągłości. jeżeli istnieją wszystkie pochodne cząstkowe rzędu p funkcji f i pochodne te są ciągłe, to pochodne wielomianu B f m (x) są zbieżne do pochodnych funkcji f. Całka J Bf m (x) może być łatwo obliczona, ponieważ: B f m (x) = m 1 m 2... m n f ( v1, v 2,..., v ) n m 1 m 2 m n J v 1 =0 v 2 =0 v n=0 n 1 S p vk,m k (x k ) dx k = k=1 0 n k=1 gdzie S = m 1 m2 v 1 =0 v 2 =0... ( ) m n v f v1 n=0 m 1, v 2 m 2,..., vn m n. (13) (m k + 1)

B f m (x) dobrze przybliża f B f m (x) przy m zbiega do funkcji f w każdym punkcie jej ciągłości. jeżeli istnieją wszystkie pochodne cząstkowe rzędu p funkcji f i pochodne te są ciągłe, to pochodne wielomianu B f m (x) są zbieżne do pochodnych funkcji f. Całka J Bf m (x) może być łatwo obliczona, ponieważ: B f m (x) = m 1 m 2... m n f ( v1, v 2,..., v ) n m 1 m 2 m n J v 1 =0 v 2 =0 v n=0 n 1 S p vk,m k (x k ) dx k = k=1 0 n k=1 gdzie S = m 1 m2 v 1 =0 v 2 =0... ( ) m n v f v1 n=0 m 1, v 2 m 2,..., vn m n. (13) (m k + 1)

B f m (x) dobrze przybliża f B f m (x) przy m zbiega do funkcji f w każdym punkcie jej ciągłości. jeżeli istnieją wszystkie pochodne cząstkowe rzędu p funkcji f i pochodne te są ciągłe, to pochodne wielomianu B f m (x) są zbieżne do pochodnych funkcji f. Całka J Bf m (x) może być łatwo obliczona, ponieważ: B f m (x) = m 1 m 2... m n f ( v1, v 2,..., v ) n m 1 m 2 m n J v 1 =0 v 2 =0 v n=0 n 1 S p vk,m k (x k ) dx k = k=1 0 n k=1 gdzie S = m 1 m2 v 1 =0 v 2 =0... ( ) m n v f v1 n=0 m 1, v 2 m 2,..., vn m n. (13) (m k + 1)

Całka I = 1 0... 1 0 f (x 1,..., x n ) dx 1...dx n może być również obliczona metodą średniej ważonej I = J f (x) g (x) dp gdzie P jest rozkładem prawdopodobieństwa zmiennej losowej o gęstości g. Załóżmy, że f (x) ε > 0. Mamy zatem: inf J f (x) = µ > 0 Wówczas wielomian Bernsteina funkcji f jest również nieujemny na kostce J.

Niech B f m (x) = n k=1 (m k + 1) Bm f (x) S Ponieważ B f m (x) > 0 oraz J B f m (x) dx = 1, to wielomian B f m (x) można traktować jako gęstość pewnych zmiennych losowych. Niech w (x) = f (x) B f m (x). Wówczas sprowadzamy zadanie obliczenia całki I do zadania w (x) dp J gdzie P jest rozkładem prawdopodobieństwa o gęstości B f m (x).

Algorytm Losujemy punkt x = (x 1,..., x n ) zgodnie z rozkładem prawdopodobieństwa o gęstości B f m (x). Obliczamy wartość funkcji w w wylosowanym punkcie. Powtarzamy N razy operacje 1,2. Za oszacowanie całki Iprzyjmujemy średnią wartość w (x) natomiast wariancję tych wartości za oszacowanie wariancji estymatora.

Algorytm Losujemy punkt x = (x 1,..., x n ) zgodnie z rozkładem prawdopodobieństwa o gęstości B f m (x). Obliczamy wartość funkcji w w wylosowanym punkcie. Powtarzamy N razy operacje 1,2. Za oszacowanie całki Iprzyjmujemy średnią wartość w (x) natomiast wariancję tych wartości za oszacowanie wariancji estymatora.

Algorytm Losujemy punkt x = (x 1,..., x n ) zgodnie z rozkładem prawdopodobieństwa o gęstości B f m (x). Obliczamy wartość funkcji w w wylosowanym punkcie. Powtarzamy N razy operacje 1,2. Za oszacowanie całki Iprzyjmujemy średnią wartość w (x) natomiast wariancję tych wartości za oszacowanie wariancji estymatora.

Algorytm Losujemy punkt x = (x 1,..., x n ) zgodnie z rozkładem prawdopodobieństwa o gęstości B f m (x). Obliczamy wartość funkcji w w wylosowanym punkcie. Powtarzamy N razy operacje 1,2. Za oszacowanie całki Iprzyjmujemy średnią wartość w (x) natomiast wariancję tych wartości za oszacowanie wariancji estymatora.

Problem losowania według rozkładu o gęstości B f m (x). Gęstość B f m (x) zapiszemy w postaci: gdzie m 1 v 1 =0 B f m (x) =... m n v n=0 m 1 v 1 =0... m n v n=0 p (v 1,..., v n ) n B mk,v k (x k ) k=1 ( ) p (v 1,..., v n ) = f v1 m 1,..., vn m n p (v 1,..., v n ) = 1 B m,v (x) = S (m + 1)! v! (m v)! x v (1 x) m v B m,v (x) jest gęstością z rozkładu beta z parametrami (v + 1, m v + 1), p (v 1,..., v n ) rozkład prawd. na zbiorze indeksów (v 1,..., v n ).

Algorytm Zgodnie z rozkładem prawdopodobieństwa p (v 1,..., v n ) wylosować punkty (v 1,..., v n ) ze zbioru indeksów (0 v 1 m 1,..., 0 v n m n ) Wygenerować n niezależnych zmiennych losowych (X 1,..., X n ) o rozkładzie beta z gęstościami odpowiednio równymi B m1,v 1 (x 1 ), B m2,v 2 (x 2 ),..., B mn,v n (x n ). Tak wylosowana zmienna losowa ma rozkład o gęstości B f m (x).

Metody sekwencyjne 14.02.2006 Seminarium szkoleniowe Rozważamy zadanie obliczenia całki b a f (x) dx W poprzednio rozważanych przypadkach : wybieraliśmy pewien estymator ψ (X ), np. f (X ), gdzie X U (a, b) lub f (X ) /g (X ), gdzie X g, itd. Losowaliśmy N punktów x 1,..., x N zgodnie z ustalonym rozkładem prawdopodobieństwa i obliczaliśmy wartość ψ (x i ) dla każdego wylosowanego punktu. N i=1 średnia ψ(x i ) N stanowiła oszacowanie całki I.

Rozważać będziemy teraz przypadek kiedy estymator ψ będzie się zmieniał w toku obliczeń. Wówczas sposób postępowania jest następujący: wybrać ciąg {ψ n }, n = 1, 2,... estymatorów wylosować ciąg punktów {x n }. Każdy z tych punktów może być losowany według innego rozkładu prawdopodobieństwa P n obliczyć wartości ψ 1 (x 1 ), ψ 2 (x 2 )... kolejnych estymatorów w kolejno wylosowanych punktach pewną funkcję Ψ n (ψ 1,..., ψ n ) przyjąć za oszacowanie całki w n tym kroku obliczeń.

Rozważać będziemy teraz przypadek kiedy estymator ψ będzie się zmieniał w toku obliczeń. Wówczas sposób postępowania jest następujący: wybrać ciąg {ψ n }, n = 1, 2,... estymatorów wylosować ciąg punktów {x n }. Każdy z tych punktów może być losowany według innego rozkładu prawdopodobieństwa P n obliczyć wartości ψ 1 (x 1 ), ψ 2 (x 2 )... kolejnych estymatorów w kolejno wylosowanych punktach pewną funkcję Ψ n (ψ 1,..., ψ n ) przyjąć za oszacowanie całki w n tym kroku obliczeń.

Rozważać będziemy teraz przypadek kiedy estymator ψ będzie się zmieniał w toku obliczeń. Wówczas sposób postępowania jest następujący: wybrać ciąg {ψ n }, n = 1, 2,... estymatorów wylosować ciąg punktów {x n }. Każdy z tych punktów może być losowany według innego rozkładu prawdopodobieństwa P n obliczyć wartości ψ 1 (x 1 ), ψ 2 (x 2 )... kolejnych estymatorów w kolejno wylosowanych punktach pewną funkcję Ψ n (ψ 1,..., ψ n ) przyjąć za oszacowanie całki w n tym kroku obliczeń.

Rozważać będziemy teraz przypadek kiedy estymator ψ będzie się zmieniał w toku obliczeń. Wówczas sposób postępowania jest następujący: wybrać ciąg {ψ n }, n = 1, 2,... estymatorów wylosować ciąg punktów {x n }. Każdy z tych punktów może być losowany według innego rozkładu prawdopodobieństwa P n obliczyć wartości ψ 1 (x 1 ), ψ 2 (x 2 )... kolejnych estymatorów w kolejno wylosowanych punktach pewną funkcję Ψ n (ψ 1,..., ψ n ) przyjąć za oszacowanie całki w n tym kroku obliczeń.

Funkcję ψ n nazywamy estymatorem pierwotnym, natomiast funkcję Ψ n estymatorem wtórnym. Metodą sekwencyjną będziemy nazywali taką metodę, według której, na każdym kroku obliczeń estymator ψ n lub rozkład P n zależą od wyników poprzednich obliczeń. Problem doboru ψ n, Ψ n oraz P n. Za dobry będziemy uważali taki wybór ψ n i Ψ n oraz P n dla którego: ciąg wariancji σ 2 (ψ n (X )) estymatorów pierwotnych jest zbieżny do nieujemnej stałej σ 2, ciąg estymatorów wtórnych Ψ n jest zbieżny do szacowanej całki I.

Jeżeli estymatory wtórne otrzymujemy za pomocą formuły liniowej w której v 1 = 1, 0 < v n < 1, czyli gdzie w (n) n Ψ n = v n ψ n + (1 v n ) Ψ n 1 Ψ n = = v n, w (n) m = v m n to można udowodnić, że: n m=1 r=m+1 w m (n) ψ m (1 v r ), m < n, 0 w (n) m 1, ciąg estymatorów Ψ n jest zbieżny do I z prawdopodobieństwem 1 ciąg wariancji σ 2 (ψ n (X )) estymatorów pierwotnych zbiega do 0.

Dziękuję za uwagę :-)