14.02.2006 Seminarium szkoleniowe 14 lutego 2006
Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna
Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna
Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna
Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna
Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna
Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna
Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna
Plan prezentacji Wprowadzenie Metoda losowania warstwowego Metoda próbkowania ważonego Metoda zmiennych kontrolnych Metoda zmiennych antytetycznych Metoda regresji Aproksymacja za pomocą wielomianów Bernsteina Metoda sekwencyjna
Wprowadzenie 14.02.2006 Seminarium szkoleniowe Zadanie: Policzyć całkę zapisaną jako iloczyn funkcji o następującej postaci: E f h (X ) = h (x) f (x) dx, (1) gdzie f (x) jest gęstością pewnego rozkładu prawdopodobieństwa o nośniku χ. Oszacowanie metodą MC: Generujemy próbę X 1,..., X m zmiennych i.i.d. z rozkładu o gęstości f (x). Wówczas χ h f (X ) = 1 m m h (X j ) (2) j=1 przybliża, zgodnie z prawem wielkich liczb, wartość oczekiwaną E f h (X ).
Wprowadzenie 14.02.2006 Seminarium szkoleniowe Zadanie: Policzyć całkę zapisaną jako iloczyn funkcji o następującej postaci: E f h (X ) = h (x) f (x) dx, (1) gdzie f (x) jest gęstością pewnego rozkładu prawdopodobieństwa o nośniku χ. Oszacowanie metodą MC: Generujemy próbę X 1,..., X m zmiennych i.i.d. z rozkładu o gęstości f (x). Wówczas χ h f (X ) = 1 m m h (X j ) (2) j=1 przybliża, zgodnie z prawem wielkich liczb, wartość oczekiwaną E f h (X ).
Przykład Policzyć całkę gdzie I = 1 0 h (x) dx, h (x) = 0 dla x < 0 1 dla 0 x < 1 2 2 dla 1 2 x < 1 0 dla x 1
Rozwiązanie metodą MC [ ) [ ) Losujemy punkty równomiernie z przedziału 0, 1 2, 1 2, 1. Niech H 1 = H 2 = 1/2 0 1 1/2 h (x) dx (3) h (x) dx. (4) Wówczas I = H 1 + H 2. Całkę (3) zapiszemy w postaci: H 1 = 1 2 1 0 h (x) dp 1 gdzie P 1 jest rozkładem równomiernym na przedziale [ ) 0, 1 2.
Losując punkty równomiernie otrzymujemy: σ 2 H 1 = 1 0 ( ) h (x) 2 ( 1 dp 1 2 0 ) h (x) 2 2 dp 1 = 0. Analogicznie wariancja σ 2 H 2 estymatora drugiej całki jest zerem. Wnioski Dla bezbłędnego oszacowania całki funkcji stałej wystarczy znajomość wartości tej funkcji w jednym punkcie przedziału całkowania. W ten sposób udało się zredukować wariancję estymatora całki I do zera.
Metoda losowania warstwowego 14.02.2006 Seminarium szkoleniowe Rozpatrujemy zadanie obliczenia całki I =... f (x 1,.x 2,..., x n ) dx 1 dx 2...dx n = Ω Ω fdx. Dzielimy Ω na rozłączne podzbiory Ω j,j = 1, 2,..., k i zapisujemy całkę I w postaci sumy całek: k I = I (j) j=1 gdzie I (j) = fdx. Ω j
Ω j miara (objętość) n wymiarowej warstwy Ω j. P j rozkład równomierny na Ω j, tzn.: P j = dx Ω j Wówczas: I (j) = Ω j fdp j. Ω j Î (j) = Ω j n j n j f (x ij ) gdzie x ij jest i tym punktem wylosowanym w j tej warstwie Ω j według rozkładu prawdopodobieństwa P j na tej warstwie. Losowanie w poszczególnych warstwach jest niezależne! i=1
Oszacowanie całki I k Î 3 = Î (j). (5) i=1 Właściwości estymatora Î3 Î3 jest nieobciążonym estymatorem całki I. Wariancja Î3 wynosi: σ 2 (Î3 ) k = i=1 Ω j σj 2 n j gdzie σ 2 j jest wariancją funkcji f na j tej warstwie: σj 2 = f 2 dp j Ej 2, E j = Ω j fdp j Ω j
Jeżeli σj 2 jest nieznane, to szacuje się je na podstawie wylosowanych punktów za pomocą wariancji sj 2 : gdzie s 2 j = 1 n j 1 n j ] 2 [f (x ij ) f j i=1 n j f j = 1 f (x ij ) n j i=1 jest wartością średnią funkcji f w punktach wylosowanych z j tej warstwy. Oszacowanie wariancji σ 2 (Î3 ) s 2 (Î3 ) k = i=1 Ω j 2 n j 1 { 1 n j n j } f 2 (x ij ) f 2 j. i=1
Losując N = n 1 + n 2 +... + n k punktów, chcemy tak dokonać podziału Ω na warstwy oraz tak ustalić liczby n 1, n 2,..., n k aby wariancja estymatora Î3 była najmniejsza. Zagadnienie to zwane jest w statystyce zagadnieniem optymalnej lokalizacji próby. Optymalny dobór warstw oraz liczb n 1, n 2,..., n k zależy oczywiście od funkcji f i obszaru całkowania Ω. Jednak przyjmując najbardziej uniwersalne metody doboru Ω j oraz n j można uzyskać znaczną redukcję wariancji estymatora Î3 w stosunku do wariancji estymatora wyznaczonego metodą podstawową.
Najprostszy przypadek Ω podzielono na jednakowo duże warstwy: Ω 1 = Ω 2 =... = Ω k = Ω /k. Z każdej warstwy losuje się jednakową liczbę punktów: otrzymujemy: n 1 = n 2 =... = n k = N/k = m σ 2 (Î31 Î 31 = Ω N ) = Ω 2 kn k j=1 i=1 k j=1 m f (x ij ) σ 2 j.
Niech E będzie średnią wartością funkcji f na Ω. W metodzie podstawowej mamy: Î 2 = Ω N N f (x i ) i=1 Można wykazać, że: σ 2 (Î2 ) = Ω 2 N σ2 f. σ 2 (Î2 ) = Ω 2 kn k j=1 Ωj σ 2j + Ω 2 N k j=1 Ω j (E j E) 2 dp σ 2 (Î31 ).
Wnioski Wariancja nawet najprostszego estymatora Î31 nigdy nie jest większa od σ 2 {Î2} uzyskanego metodą podstawową. Stosując losowanie warstwowe zmniejszamy wariancję o wielkość Ω 2 kj=1 N (E j E) 2 dp, która jest równa zeru wtedy i tylko wtedy, gdy dla każdego j mamy (E j E) 2 dp = 0. Ω j Korzyść z zastosowania losowania warstwowego jest tym większa, im bardziej wartości średnie E j funkcji na poszczególnych warstwach będą różniły się między sobą.
Wnioski Wariancja nawet najprostszego estymatora Î31 nigdy nie jest większa od σ 2 {Î2} uzyskanego metodą podstawową. Stosując losowanie warstwowe zmniejszamy wariancję o wielkość Ω 2 kj=1 N (E j E) 2 dp, która jest równa zeru wtedy i tylko wtedy, gdy dla każdego j mamy (E j E) 2 dp = 0. Ω j Korzyść z zastosowania losowania warstwowego jest tym większa, im bardziej wartości średnie E j funkcji na poszczególnych warstwach będą różniły się między sobą.
Wnioski Wariancja nawet najprostszego estymatora Î31 nigdy nie jest większa od σ 2 {Î2} uzyskanego metodą podstawową. Stosując losowanie warstwowe zmniejszamy wariancję o wielkość Ω 2 kj=1 N (E j E) 2 dp, która jest równa zeru wtedy i tylko wtedy, gdy dla każdego j mamy (E j E) 2 dp = 0. Ω j Korzyść z zastosowania losowania warstwowego jest tym większa, im bardziej wartości średnie E j funkcji na poszczególnych warstwach będą różniły się między sobą.
Metoda średniej ważonej Policzyć całkę I = b Niech g będzie taką funkcją, że: a f (x) dx. (6) g (x) > 0 dla a x b, oraz b a g (x) dx = 1. Funkcję g można traktować jako gęstość pewnej zmiennej losowej. Wówczasz całkę (6) można zapisać w postaci: I = b gdzie dp = g (x) dx. a f (x) b g (x) g (x) dx lub I = f (x) g (x) dp a
Algorytm Wylosować na przedziale (a, b) punkt x i zgodnie z rozkładem prawdopodobieństwa P Obliczyć wartość f (x i ) /g (x i ) funkcji podcałkowej w tym punkcie Powtórzyć obliczenia dla i = 1, 2,..., N i obliczyć wartość średnią 1 N f (x i ) /g (x i ). (7) N i=1 Wielkość (7) przyjąć jako oszacowanie całki I
Algorytm Wylosować na przedziale (a, b) punkt x i zgodnie z rozkładem prawdopodobieństwa P Obliczyć wartość f (x i ) /g (x i ) funkcji podcałkowej w tym punkcie Powtórzyć obliczenia dla i = 1, 2,..., N i obliczyć wartość średnią 1 N f (x i ) /g (x i ). (7) N i=1 Wielkość (7) przyjąć jako oszacowanie całki I
Algorytm Wylosować na przedziale (a, b) punkt x i zgodnie z rozkładem prawdopodobieństwa P Obliczyć wartość f (x i ) /g (x i ) funkcji podcałkowej w tym punkcie Powtórzyć obliczenia dla i = 1, 2,..., N i obliczyć wartość średnią 1 N f (x i ) /g (x i ). (7) N i=1 Wielkość (7) przyjąć jako oszacowanie całki I
Algorytm Wylosować na przedziale (a, b) punkt x i zgodnie z rozkładem prawdopodobieństwa P Obliczyć wartość f (x i ) /g (x i ) funkcji podcałkowej w tym punkcie Powtórzyć obliczenia dla i = 1, 2,..., N i obliczyć wartość średnią 1 N f (x i ) /g (x i ). (7) N i=1 Wielkość (7) przyjąć jako oszacowanie całki I
Problem Dobór funkcji g tak, aby wariancja σf 2 /g = b a była jak najmniejsza. ( ) f (x) 2 g(x) g (x) dx I 2 Najbardziej ogólne rozwiązanie Wybrać funkcję g w taki sposób, aby f /g była jak najbardziej stała na całym obszarze całkowania (a, b). Funkcja g powinna więc jakoś naśladować f. Uwaga Jeżeli funkcja g jest zbyt skomplikowana, to wygenerowanie liczb losowych o gęstości g będzie trudne.
Zagadnienie doboru wag Można wykazać, że: ( b 2 ( b 2 σf 2 /g f (x) dx) f (x) dx). a a Najmnieszają możliwą wariancją do uzyskania jest zatem ( b 2 ( b 2 σ0 2 = f (x) dx) f (x) dx). a a Taką wariancję uzyskuje się wtedy, gdy g (x) = λ f (x), gdzie λ jest dowolną stałą.
Jeżeli funkcja f jest nieujemna na przedziale całkowania, to uzyskamy σ0 2 = 0 wtedy, gdy waga g (x) = λf (x). Stała musi być wyznaczona z warunku b a g (x) dx = 1, czyli: λ = b a 1. f (x) dx UWAGA Chociaż teoretycznie wariancja estymatora f (X ) /g (X ) może być zredukowana do zera, jednak praktycznie jest to niemożliwe, ponieważ do skonstruowania takiej wagi potrzebna jest stała λ, której znajomość jest równoważna znajomości wartości obliczanej całki!
W przypadku bardziej skomplikowanych funkcji podcałkowych oraz bardziej skomplikowanych obszarów całkowania wybór wag g nie jest sprawą łatwą. Możliwe rozwiązania problemu Konstrukcja wag przez aproksymację wielomianami Bernsteina Metoda adaptacyjna Metoda sekwencyjna
W przypadku bardziej skomplikowanych funkcji podcałkowych oraz bardziej skomplikowanych obszarów całkowania wybór wag g nie jest sprawą łatwą. Możliwe rozwiązania problemu Konstrukcja wag przez aproksymację wielomianami Bernsteina Metoda adaptacyjna Metoda sekwencyjna
W przypadku bardziej skomplikowanych funkcji podcałkowych oraz bardziej skomplikowanych obszarów całkowania wybór wag g nie jest sprawą łatwą. Możliwe rozwiązania problemu Konstrukcja wag przez aproksymację wielomianami Bernsteina Metoda adaptacyjna Metoda sekwencyjna
Metoda adaptacyjna doboru wag 1. Początkowo wybieramy dowolną wagę g 0. 2. Losujemy według tego rozkładu n 0 punktów. 3. Korzystając z wyników dotychczasowych obliczeń wybieramy nową lepszą wagę g 1. 4. Analogicznie wybiera się następne wagi g 2, g 3,..., przy czym każda następna waga jest lepsza od poprzedniej w tym sensie, że: σ 2 f /g 0 σ 2 f /g 1...
Metoda adaptacyjna doboru wag 1. Początkowo wybieramy dowolną wagę g 0. 2. Losujemy według tego rozkładu n 0 punktów. 3. Korzystając z wyników dotychczasowych obliczeń wybieramy nową lepszą wagę g 1. 4. Analogicznie wybiera się następne wagi g 2, g 3,..., przy czym każda następna waga jest lepsza od poprzedniej w tym sensie, że: σ 2 f /g 0 σ 2 f /g 1...
Metoda adaptacyjna doboru wag 1. Początkowo wybieramy dowolną wagę g 0. 2. Losujemy według tego rozkładu n 0 punktów. 3. Korzystając z wyników dotychczasowych obliczeń wybieramy nową lepszą wagę g 1. 4. Analogicznie wybiera się następne wagi g 2, g 3,..., przy czym każda następna waga jest lepsza od poprzedniej w tym sensie, że: σ 2 f /g 0 σ 2 f /g 1...
Metoda adaptacyjna doboru wag 1. Początkowo wybieramy dowolną wagę g 0. 2. Losujemy według tego rozkładu n 0 punktów. 3. Korzystając z wyników dotychczasowych obliczeń wybieramy nową lepszą wagę g 1. 4. Analogicznie wybiera się następne wagi g 2, g 3,..., przy czym każda następna waga jest lepsza od poprzedniej w tym sensie, że: σ 2 f /g 0 σ 2 f /g 1...
Metoda adaptacyjna doboru wag jest szczególnie efektywna, jeżeli wagi g i wybiera się z pewnej rodziny rozkładów różniących się między sobą tylko wartościami parametrów. Niech: ( α (i) = α (i) ) 1, α(i) 2,..., α(i) m wektor parametrów wyznaczających g i. σ 2 ( α (i)) wariancja estymatora f (X ) /g i (X ). Zadanie Wyznacz taki punktu α (opt) w m wymiarowej przestrzeni parametrów rozkładów g i, dla którego wariancja σ 2 ( α (i)) osiąga minimum.
Metoda zmiennych kontrolnych Zaobserwowaliśmy już, że błąd oszacowania całki jest tym mniejszy im funkcja podcałkowa jest bardziej stała. Technika losowania warstwowego rozbija obszar całkowania na podobszary, w których funkcja f jest mniej zmienna. Technika średniej ważonej polega na takim doborze wag dla funkcji podcałkowej f, żeby iloraz f /g był funkcją możliwie stałą na obszarze całkowania. Technika zmiennych kontrolnych polega na doborze takiej funkcji g, żeby różnica (f g) była możliwie stała.
Metoda zmiennych kontrolnych Zaobserwowaliśmy już, że błąd oszacowania całki jest tym mniejszy im funkcja podcałkowa jest bardziej stała. Technika losowania warstwowego rozbija obszar całkowania na podobszary, w których funkcja f jest mniej zmienna. Technika średniej ważonej polega na takim doborze wag dla funkcji podcałkowej f, żeby iloraz f /g był funkcją możliwie stałą na obszarze całkowania. Technika zmiennych kontrolnych polega na doborze takiej funkcji g, żeby różnica (f g) była możliwie stała.
Metoda zmiennych kontrolnych Zaobserwowaliśmy już, że błąd oszacowania całki jest tym mniejszy im funkcja podcałkowa jest bardziej stała. Technika losowania warstwowego rozbija obszar całkowania na podobszary, w których funkcja f jest mniej zmienna. Technika średniej ważonej polega na takim doborze wag dla funkcji podcałkowej f, żeby iloraz f /g był funkcją możliwie stałą na obszarze całkowania. Technika zmiennych kontrolnych polega na doborze takiej funkcji g, żeby różnica (f g) była możliwie stała.
Obliczyć całkę I = b a f (x) dx = b a b [f (x) g (x)] dx + g (x) dx. a Jeżeli funkcja g będzie wybrana tak, aby b a g (x) dx mogła być dokładnie obliczona, to dla oszacowania Î = 1 N N [f (x i ) g (x i )] + γ i=1 gdzie γ = b a g (x) dx, otrzymamy wariancję (Î ) σ 2 = σf 2 g /N = 1 ( b ) b 2 [f (x) g (x)] 2 dx [f (x) g (x)] dx N a a
Powyższe zadanie sprowadza się do obliczenia całki b a [f (x) g (x)] dx. Najprostszy estymator: różnica f (X ) g (X ), gdzie X jest zmienną losową o rozkładzie równomiernym na przedziale (a, b). Wariancja estymatora f (X ) g (X ): σ 2 f g = σ 2 [f (X ) g (X )] = σ 2 [f (X )] + σ 2 [g (X )] 2cov [f (X ), g (X )] Jeżeli zmienne losowe są silnie dodatnio skorelowane, to ich kowariancja jest duża i dodatnia. Wówczas wariancja σ 2 f g jest mała.
Powyższe zadanie sprowadza się do obliczenia całki b a [f (x) g (x)] dx. Najprostszy estymator: różnica f (X ) g (X ), gdzie X jest zmienną losową o rozkładzie równomiernym na przedziale (a, b). Wariancja estymatora f (X ) g (X ): σ 2 f g = σ 2 [f (X ) g (X )] = σ 2 [f (X )] + σ 2 [g (X )] 2cov [f (X ), g (X )] Jeżeli zmienne losowe są silnie dodatnio skorelowane, to ich kowariancja jest duża i dodatnia. Wówczas wariancja σ 2 f g jest mała.
Powyższe zadanie sprowadza się do obliczenia całki b a [f (x) g (x)] dx. Najprostszy estymator: różnica f (X ) g (X ), gdzie X jest zmienną losową o rozkładzie równomiernym na przedziale (a, b). Wariancja estymatora f (X ) g (X ): σ 2 f g = σ 2 [f (X ) g (X )] = σ 2 [f (X )] + σ 2 [g (X )] 2cov [f (X ), g (X )] Jeżeli zmienne losowe są silnie dodatnio skorelowane, to ich kowariancja jest duża i dodatnia. Wówczas wariancja σ 2 f g jest mała.
Proponowana metoda będzie opłacalna wtedy, gdy ρ 1 1 l. gdzie ρ jest współczynnikiem korelacji zmiennych f i g notomiast l jest pewną stałą (jeżeli przyjmiemy, że obliczenie funkcji g jest równie pracochłonne jak obliczenie funkcji f to l = 2). Definicja zmiennej kontrolnej Zmienną losową g (X ) o takich własnościach, że współczynnik korelacji ρ pomiędzy zmiennymi f (X ) i g (X ) spełnia warunek ρ > 1 1 l całka b a g (x) dx jest znana nazywamy zmienną kontrolną dla f (X ).
Metoda zmiennych antytetycznych Przypuśćmy, że do obliczenia całki I = b a f (x) dx (8) dysponujemy dwoma estmatorami nieobciążonymi f 1 (ζ) oraz f 2 (η) gdzie ζ i η są pewnymi zmiennymi losowymi. Wówczas F 2 = 1 2 (f 1 + f 2 ) jest również estymatorem nieobciążonym całki (8). Wariancja estymatora F 2 σ 2 (F 2 ) = 1 4 σ2 (f 1 ) + 1 4 σ2 (f 2 ) + 1 2 cov (f 1, f 2 ).
Uogólnione na przypadek wielu estymatorów całki I Do obliczenia całki (8) dysponujemy m nieobciążonymi estymatorami f 1 (ζ 1 ), f 2 (ζ 2 ),..., f m (ζ m ), gdzie ζ 1, ζ 2,..., ζ m są pewnymi zmiennymi losowymi. Wówczas: F m (ζ 1, ζ 2,..., ζ m ) = 1 m (f 1 (ζ 1 ) + f 2 (ζ 2 ) +... + f m (ζ m )) jest również nieobciążonym estymatorem całki I, a jego wariancja σ 2 (F m ) = 1 m m 2 σ 2 (f i ) + 2 m 2 cov (f i, f j ) i=1 i<j Zadanie Wprowadzić takie zależności między zmiennymi ζ 1, ζ 2,..., ζ m aby wariancja σ 2 (F m ) była możliwie najmniejsza.
Przykłady najczęściej używanych estymatorów zbudowanych na koncepcji zmiennych antytetycznych 1) Zakładamy, że funkcja f w całce I = b a f (x) dx jest malejąca. Budujemy estymator: f 2 (ς) = 1 [f (ς) + f (1 ς)]. (9) 2
Niech gdzie I (2) = b a f 2 (x) dx f 2 (x) = 1 [f (x) + f (1 x)]. 2 Wówczas: I (2) = I f 2 jest bardziej stała na przedziale (a, b) niż funkcja f σ 2 {f 2 } σ 2 {f } całka I (2) = b a f 2 (x) dx w przypadku losowania tej samej liczby punktów będzie szacowała dokładniej niż całka I = b a f (x) dx.
2) Dla funkcji monotonicznej na przedziale (a, b) można skonstruować bardziej ogólny estymator I α f (X ) = αf (αx ) + (1 α) f [1 (1 α) X ]) (10) gdzie 0 < α < 1, X U (a, b). Niech σ 2 [I α f (X )] = V (α). Wówczas mamy V (α) = b a { } αf (αx) + (1 α) f [1 (1 α) x] 2 dx I 2 Problem Dobrać optymalne α, tak aby σ 2 [I α f (X )] osiągała minimum. Wariancja V (α) osiąga minimum gdy dv (α) /dα = 0. Komentarz Wyznaczenie optymalnej wartości α 0 może być zadaniem bardzo trudnym (nawet trudniejszym niż obliczenie całki I ).
Metoda regresji 14.02.2006 Seminarium szkoleniowe Przypuśćmy, że do obliczenia całki I = b a f (x) dx (11) dysponujemy m estymatorami nieobciążonym Î1,..., Îm. Wówczas estymator Î = a 1Î1 +... + a mîm gdzie a 1 +... + a m = 1, jest również) estymatorem nieobciążonym całki I. Wariancja estymatora σa (Î 2 zależy od odpowiedniego doboru współczynników a i. Zadanie ) Dobrać a 1,..., a m tak, aby σa (Î 2 była najmniejsza.
Niech V = (v ij ), gdzie (v ij ) = cov (Îi Îj), oznacza macierz kowariancji estymatorów I j. Wówczas: a i = 1 v m v ij j=1 gdzie v ij są elementami macierzy V 1, natomiast v suma wszystkich elementów macierzy V 1 : v = m i=1 j=1 Wariancja najlepszego estymatora m v ij. (Î ) σ 2 = 1 v.
Oszacowania kowariancji estymatorów Îj. v ij = 1 N 1 N ) (Îik (Îjk Îj.) Îi. k=1 gdzie Îik jest wartością estymatora Îi w k tym punkcie, k = 1,...N, oraz Îi. = 1 N N Îik k=1 Czasami wygodniejszy jest rachunkowo wzór: v ij = 1 N 1 N k=1 ÎikÎjk 1 ( N ) ( N ) N 1 Îik Îjk k=1 k=1
Uwagi końcowe Metody regresji daje się łatwo stosować przy obliczaniu całek wielokrotnych. Umiejętność skonstruowania kilku estymatorów nieobciążonych obliczanej całki, pozwala za pomocą regresji stworzyć taką liniową kombinację tych estymatorów, która prowadzi do estymatora nieobciążonego o minimalnej wariancji. Fakt, że skonstruowanie nieobciążonych estymatorów nie jest zbyt kłopotliwe, czyni tę metodę uniwersalną i wygodną.
Uwagi końcowe Metody regresji daje się łatwo stosować przy obliczaniu całek wielokrotnych. Umiejętność skonstruowania kilku estymatorów nieobciążonych obliczanej całki, pozwala za pomocą regresji stworzyć taką liniową kombinację tych estymatorów, która prowadzi do estymatora nieobciążonego o minimalnej wariancji. Fakt, że skonstruowanie nieobciążonych estymatorów nie jest zbyt kłopotliwe, czyni tę metodę uniwersalną i wygodną.
Uwagi końcowe Metody regresji daje się łatwo stosować przy obliczaniu całek wielokrotnych. Umiejętność skonstruowania kilku estymatorów nieobciążonych obliczanej całki, pozwala za pomocą regresji stworzyć taką liniową kombinację tych estymatorów, która prowadzi do estymatora nieobciążonego o minimalnej wariancji. Fakt, że skonstruowanie nieobciążonych estymatorów nie jest zbyt kłopotliwe, czyni tę metodę uniwersalną i wygodną.
Aproksymacja za pomocą wielomianów Bernsteina Rozważamy zagadnienie obliczenia całki I = 1 0 1... f (x 1,..., x n ) dx 1...dx n (12) 0 Całkę (12) zapisywać będziemy krótko w postaci I = J f (x) dx gdzie x = (x 1,..., x n ) natomiast J jest kostką jednostkową (0 x 1 1,..., 0 x n 1) w n wymiarowej przestrzeni liczb rzeczywistych.
Stosując metodę zmiennej kontrolnej z funkcją g zadanie obliczenia całki I = [f (x) g (x)] dx + g (x) dx J J sprowadza się do obliczenia metodą MC całki [f (x) g (x)] dx. J Jako funkcji kontrolnej g użyjemy teraz wielomianu Bernsteina funkcji f : B f m (x) = B f m 1,m 2,...,m n (x 1,..., x n ) = gdzie m 1 m 2 v 1 =0 v 2 =0 p q,r (x) =... m n v n=0 f ( v1, v 2,..., v ) n n m 1 m 2 m n k=1 ( ) r x q (1 x) r q, 0 q r. q p vk,m k (x k )
B f m (x) dobrze przybliża f B f m (x) przy m zbiega do funkcji f w każdym punkcie jej ciągłości. jeżeli istnieją wszystkie pochodne cząstkowe rzędu p funkcji f i pochodne te są ciągłe, to pochodne wielomianu B f m (x) są zbieżne do pochodnych funkcji f. Całka J Bf m (x) może być łatwo obliczona, ponieważ: B f m (x) = m 1 m 2... m n f ( v1, v 2,..., v ) n m 1 m 2 m n J v 1 =0 v 2 =0 v n=0 n 1 S p vk,m k (x k ) dx k = k=1 0 n k=1 gdzie S = m 1 m2 v 1 =0 v 2 =0... ( ) m n v f v1 n=0 m 1, v 2 m 2,..., vn m n. (13) (m k + 1)
B f m (x) dobrze przybliża f B f m (x) przy m zbiega do funkcji f w każdym punkcie jej ciągłości. jeżeli istnieją wszystkie pochodne cząstkowe rzędu p funkcji f i pochodne te są ciągłe, to pochodne wielomianu B f m (x) są zbieżne do pochodnych funkcji f. Całka J Bf m (x) może być łatwo obliczona, ponieważ: B f m (x) = m 1 m 2... m n f ( v1, v 2,..., v ) n m 1 m 2 m n J v 1 =0 v 2 =0 v n=0 n 1 S p vk,m k (x k ) dx k = k=1 0 n k=1 gdzie S = m 1 m2 v 1 =0 v 2 =0... ( ) m n v f v1 n=0 m 1, v 2 m 2,..., vn m n. (13) (m k + 1)
B f m (x) dobrze przybliża f B f m (x) przy m zbiega do funkcji f w każdym punkcie jej ciągłości. jeżeli istnieją wszystkie pochodne cząstkowe rzędu p funkcji f i pochodne te są ciągłe, to pochodne wielomianu B f m (x) są zbieżne do pochodnych funkcji f. Całka J Bf m (x) może być łatwo obliczona, ponieważ: B f m (x) = m 1 m 2... m n f ( v1, v 2,..., v ) n m 1 m 2 m n J v 1 =0 v 2 =0 v n=0 n 1 S p vk,m k (x k ) dx k = k=1 0 n k=1 gdzie S = m 1 m2 v 1 =0 v 2 =0... ( ) m n v f v1 n=0 m 1, v 2 m 2,..., vn m n. (13) (m k + 1)
B f m (x) dobrze przybliża f B f m (x) przy m zbiega do funkcji f w każdym punkcie jej ciągłości. jeżeli istnieją wszystkie pochodne cząstkowe rzędu p funkcji f i pochodne te są ciągłe, to pochodne wielomianu B f m (x) są zbieżne do pochodnych funkcji f. Całka J Bf m (x) może być łatwo obliczona, ponieważ: B f m (x) = m 1 m 2... m n f ( v1, v 2,..., v ) n m 1 m 2 m n J v 1 =0 v 2 =0 v n=0 n 1 S p vk,m k (x k ) dx k = k=1 0 n k=1 gdzie S = m 1 m2 v 1 =0 v 2 =0... ( ) m n v f v1 n=0 m 1, v 2 m 2,..., vn m n. (13) (m k + 1)
Całka I = 1 0... 1 0 f (x 1,..., x n ) dx 1...dx n może być również obliczona metodą średniej ważonej I = J f (x) g (x) dp gdzie P jest rozkładem prawdopodobieństwa zmiennej losowej o gęstości g. Załóżmy, że f (x) ε > 0. Mamy zatem: inf J f (x) = µ > 0 Wówczas wielomian Bernsteina funkcji f jest również nieujemny na kostce J.
Niech B f m (x) = n k=1 (m k + 1) Bm f (x) S Ponieważ B f m (x) > 0 oraz J B f m (x) dx = 1, to wielomian B f m (x) można traktować jako gęstość pewnych zmiennych losowych. Niech w (x) = f (x) B f m (x). Wówczas sprowadzamy zadanie obliczenia całki I do zadania w (x) dp J gdzie P jest rozkładem prawdopodobieństwa o gęstości B f m (x).
Algorytm Losujemy punkt x = (x 1,..., x n ) zgodnie z rozkładem prawdopodobieństwa o gęstości B f m (x). Obliczamy wartość funkcji w w wylosowanym punkcie. Powtarzamy N razy operacje 1,2. Za oszacowanie całki Iprzyjmujemy średnią wartość w (x) natomiast wariancję tych wartości za oszacowanie wariancji estymatora.
Algorytm Losujemy punkt x = (x 1,..., x n ) zgodnie z rozkładem prawdopodobieństwa o gęstości B f m (x). Obliczamy wartość funkcji w w wylosowanym punkcie. Powtarzamy N razy operacje 1,2. Za oszacowanie całki Iprzyjmujemy średnią wartość w (x) natomiast wariancję tych wartości za oszacowanie wariancji estymatora.
Algorytm Losujemy punkt x = (x 1,..., x n ) zgodnie z rozkładem prawdopodobieństwa o gęstości B f m (x). Obliczamy wartość funkcji w w wylosowanym punkcie. Powtarzamy N razy operacje 1,2. Za oszacowanie całki Iprzyjmujemy średnią wartość w (x) natomiast wariancję tych wartości za oszacowanie wariancji estymatora.
Algorytm Losujemy punkt x = (x 1,..., x n ) zgodnie z rozkładem prawdopodobieństwa o gęstości B f m (x). Obliczamy wartość funkcji w w wylosowanym punkcie. Powtarzamy N razy operacje 1,2. Za oszacowanie całki Iprzyjmujemy średnią wartość w (x) natomiast wariancję tych wartości za oszacowanie wariancji estymatora.
Problem losowania według rozkładu o gęstości B f m (x). Gęstość B f m (x) zapiszemy w postaci: gdzie m 1 v 1 =0 B f m (x) =... m n v n=0 m 1 v 1 =0... m n v n=0 p (v 1,..., v n ) n B mk,v k (x k ) k=1 ( ) p (v 1,..., v n ) = f v1 m 1,..., vn m n p (v 1,..., v n ) = 1 B m,v (x) = S (m + 1)! v! (m v)! x v (1 x) m v B m,v (x) jest gęstością z rozkładu beta z parametrami (v + 1, m v + 1), p (v 1,..., v n ) rozkład prawd. na zbiorze indeksów (v 1,..., v n ).
Algorytm Zgodnie z rozkładem prawdopodobieństwa p (v 1,..., v n ) wylosować punkty (v 1,..., v n ) ze zbioru indeksów (0 v 1 m 1,..., 0 v n m n ) Wygenerować n niezależnych zmiennych losowych (X 1,..., X n ) o rozkładzie beta z gęstościami odpowiednio równymi B m1,v 1 (x 1 ), B m2,v 2 (x 2 ),..., B mn,v n (x n ). Tak wylosowana zmienna losowa ma rozkład o gęstości B f m (x).
Metody sekwencyjne 14.02.2006 Seminarium szkoleniowe Rozważamy zadanie obliczenia całki b a f (x) dx W poprzednio rozważanych przypadkach : wybieraliśmy pewien estymator ψ (X ), np. f (X ), gdzie X U (a, b) lub f (X ) /g (X ), gdzie X g, itd. Losowaliśmy N punktów x 1,..., x N zgodnie z ustalonym rozkładem prawdopodobieństwa i obliczaliśmy wartość ψ (x i ) dla każdego wylosowanego punktu. N i=1 średnia ψ(x i ) N stanowiła oszacowanie całki I.
Rozważać będziemy teraz przypadek kiedy estymator ψ będzie się zmieniał w toku obliczeń. Wówczas sposób postępowania jest następujący: wybrać ciąg {ψ n }, n = 1, 2,... estymatorów wylosować ciąg punktów {x n }. Każdy z tych punktów może być losowany według innego rozkładu prawdopodobieństwa P n obliczyć wartości ψ 1 (x 1 ), ψ 2 (x 2 )... kolejnych estymatorów w kolejno wylosowanych punktach pewną funkcję Ψ n (ψ 1,..., ψ n ) przyjąć za oszacowanie całki w n tym kroku obliczeń.
Rozważać będziemy teraz przypadek kiedy estymator ψ będzie się zmieniał w toku obliczeń. Wówczas sposób postępowania jest następujący: wybrać ciąg {ψ n }, n = 1, 2,... estymatorów wylosować ciąg punktów {x n }. Każdy z tych punktów może być losowany według innego rozkładu prawdopodobieństwa P n obliczyć wartości ψ 1 (x 1 ), ψ 2 (x 2 )... kolejnych estymatorów w kolejno wylosowanych punktach pewną funkcję Ψ n (ψ 1,..., ψ n ) przyjąć za oszacowanie całki w n tym kroku obliczeń.
Rozważać będziemy teraz przypadek kiedy estymator ψ będzie się zmieniał w toku obliczeń. Wówczas sposób postępowania jest następujący: wybrać ciąg {ψ n }, n = 1, 2,... estymatorów wylosować ciąg punktów {x n }. Każdy z tych punktów może być losowany według innego rozkładu prawdopodobieństwa P n obliczyć wartości ψ 1 (x 1 ), ψ 2 (x 2 )... kolejnych estymatorów w kolejno wylosowanych punktach pewną funkcję Ψ n (ψ 1,..., ψ n ) przyjąć za oszacowanie całki w n tym kroku obliczeń.
Rozważać będziemy teraz przypadek kiedy estymator ψ będzie się zmieniał w toku obliczeń. Wówczas sposób postępowania jest następujący: wybrać ciąg {ψ n }, n = 1, 2,... estymatorów wylosować ciąg punktów {x n }. Każdy z tych punktów może być losowany według innego rozkładu prawdopodobieństwa P n obliczyć wartości ψ 1 (x 1 ), ψ 2 (x 2 )... kolejnych estymatorów w kolejno wylosowanych punktach pewną funkcję Ψ n (ψ 1,..., ψ n ) przyjąć za oszacowanie całki w n tym kroku obliczeń.
Funkcję ψ n nazywamy estymatorem pierwotnym, natomiast funkcję Ψ n estymatorem wtórnym. Metodą sekwencyjną będziemy nazywali taką metodę, według której, na każdym kroku obliczeń estymator ψ n lub rozkład P n zależą od wyników poprzednich obliczeń. Problem doboru ψ n, Ψ n oraz P n. Za dobry będziemy uważali taki wybór ψ n i Ψ n oraz P n dla którego: ciąg wariancji σ 2 (ψ n (X )) estymatorów pierwotnych jest zbieżny do nieujemnej stałej σ 2, ciąg estymatorów wtórnych Ψ n jest zbieżny do szacowanej całki I.
Jeżeli estymatory wtórne otrzymujemy za pomocą formuły liniowej w której v 1 = 1, 0 < v n < 1, czyli gdzie w (n) n Ψ n = v n ψ n + (1 v n ) Ψ n 1 Ψ n = = v n, w (n) m = v m n to można udowodnić, że: n m=1 r=m+1 w m (n) ψ m (1 v r ), m < n, 0 w (n) m 1, ciąg estymatorów Ψ n jest zbieżny do I z prawdopodobieństwem 1 ciąg wariancji σ 2 (ψ n (X )) estymatorów pierwotnych zbiega do 0.
Dziękuję za uwagę :-)