WAE Jarosław Arabas Adaptacja i samoczynna adaptacja parametrów AE Algorytm CMA-ES
Dynamika mutacyjnego AE Mutacja gaussowska σ=0.1 Wszystkie wygenerowane punkty Wartość średnia jakości punktów populacji
Dynamika mutacyjnego AE Mutacja gaussowska σ=0.55 Wszystkie wygenerowane punkty Wartość średnia jakości punktów populacji
Dynamika mutacyjnego AE Mutacja gaussowska σ=5 Wszystkie wygenerowane punkty Wartość średnia jakości punktów populacji
Eksploracja i eksploatacja Sterowanie presją selekcji Reprodukcja progowa wartość turniejowa wielkość szranek s θ proporcjonalna modyfikacja wartości funkcji celu (fitness scaling) Im większe zróżnicowanie prawdopodobieństwa selekcji, tym większa presja selekcji Sukcesja jeśli jest elitarna, to zwiększa presję selekcji Rozłożenie populacji w przestrzeni zależne od funkcji celu
Eksploracja i eksploatacja Rozpraszanie populacji w sposób niezależny od wartości funkcji celu Mutacja - zasięg mutacji (wariancja v m ) - im jest większa, tym większa różnorodność Krzyżowanie uśredniające im większe jego prawdopodobieństwo p c, tym mniejsza różnorodność Krzyżowanie wymieniające rozprasza populację poprzez częściową dekorelację wymiarów
Adaptacja parametrów AE Wartości parametrów Sterowanie parametrami uchyb Algorytm ewolucyjny Monitor dynamiki AE wielkości zagregowane generacja rozwiązań Model odniesienia
Zaprogramowane sterowanie parametrami AE Wartości parametrów Sterowanie parametrami Algorytm ewolucyjny generacja rozwiązań
Samoczynna adaptacja parametrów AE Sterowanie AE Populacja punkt przestrzeni przeszukiwań parametry mutacji mutacja z wbudowaną modyfikacją parametrów punkt przestrzeni przeszukiwań parametry mutacji generacja rozwiązań Reprezentacja osobnika zawiera parametry Parametry określają sposób przekształcania punktu
Samoczynna adaptacja parametrów AE Populacja punkt przestrzeni przeszukiwań adaptowane parametry Reprezentacja osobnika zawiera parametry punkt przestrzeni przeszukiwań adaptowane parametry Parametry określają sposób przekształcania punktu generacja rozwiązań
Przykład adaptacji mutacji Sterowanie zaprogramowane Reguła 1/5 liczby sukcesów Samoczynna adaptacja (Schwefel, Rechenberg) adaptacja parametrów
Zaprogramowane sterowanie parametrami
Liczba sukcesów w wyniku mutacji
Zależność tempa zbieżności od zasięgu mutacji (alg. wspinaczkowy) Rysunek z: A. Auger, N. Hansen: CMA-ES Evolution Strategies and Covariance Matrix Adaptation, tutorial, GECCO'2011
Zależność tempa zbieżności od zasięgu mutacji (alg. wspinaczkowy) okno ewolucji Rysunek z: A. Auger, N. Hansen: CMA-ES Evolution Strategies and Covariance Matrix Adaptation, tutorial, GECCO'2011
Reguła 1/5 liczby sukcesów Średnia odległość mutantów od rodzica(średnia długość kroku) jest równa standardowemu odchyleniu Empirycznie dobrana wartość minimalizująca czas dojścia do akceptowalnego poziomu wartości funkcji celu Wraz ze wzrostem wariancji spada proporcja mutantów o jakości lepszej od rodzica
Reguła 1/5 liczby sukcesów Liczba mutacji w wyniku których mutant jest lepszy od rodzica powinna wynosić 1/5 Sterowanie wariancją mutacji Pierwotnie stosowana do (1+1)-ES, czyli algorytmu wspinaczkowego σ(t+k)=a σ(t) gdy p(sukces)>0.2 σ(t+k)= 1 a σ(t) gdy p(sukces)<0.2 0.817 a 1
Mutacja wariantowa z wyborem zależnym od poprawy Wariant mutacji #1 p 1 wybór Wariant mutacji #K p K Prawdopodobieństwo wyboru zależne od tego, ile mutantów było lepsze od ich rodziców Zapominanie
Mutacja wariantowa z wyborem zależnym od poprawy procedure mutation( x) j =select j where p sel ( j)= n s ( j) y=mutation(x, j ) if (success( j )) n s ( j )=n s ( j )+α n s ( j)=β n s ( j) return( y) K k=1 n s (k) ns skumulowana liczba sukcesów dla każdego wariantu mutacji
Samoczynna adaptacja zasięgu mutacji procedure mutation(x) σ j =σ j exp(τ a+τ' a j ) where τ= 1 2n, τ '=1 2 n, a N (0,1),a j N (0,1) y j =x j +σ j d j where d j N (0,1) return( y)
Adaptacja skumulowanego kroku algorytm CSA-ES Rysunek z: A. Auger, N. Hansen: CMA-ES Evolution Strategies and Covariance Matrix Adaptation, tutorial, GECCO'2011
Adaptacja skumulowanego kroku algorytm CSA-ES c σ 4/n, d σ 1, p σ =0 while! stop generuj d i (t) N (0, I ),i=1... λ oblicz q i (t)=q (m(t)+σ(t) d i (t )) sortuj według q i (t) μ Δ(t )= μ 1 i=1 d i (t) m(t+1)=m(t)+σ(t) Δ(t) p σ (t+1)=(1 c σ ) p σ (t )+ 1 (1 c σ ) 2 μ Δ(t) σ(t+1)=σ(t) exp( c ( p σ σ d σ E N (0, I ) 1 )) t t+1
Adaptacja skumulowanego kroku algorytm CSA-ES Rysunek z: A. Auger, N. Hansen: CMA-ES Evolution Strategies and Covariance Matrix Adaptation, tutorial, GECCO'2011
Modyfikacja macierzy kowariancji algorytm CMA-ES (wersja 0) C(1)=I while! stop generuj d i (t) N (0,C (t)),i=1... λ oblicz q i (t)=q (m(t)+σ(t) d i (t )) sortuj według q i (t) μ Δ(t )= μ 1 i=1 d i (t) m(t+1)=m(t)+σ(t ) Δ(t ) C (t+1)=(1 c cov )C (t )+c cov μ Δ(t)Δ(t ) T t t+1
Adaptacja macierzy kowariancji algorytm CMA-ES μ Δ(t)= 1 μ i=1 d i (t) d i (t) σ(t ) N (0,C (t )),i=1...λ C(t+1)=(1 c cov )C(t)+c cov μ Δ(t)Δ(t) T Rysunek z: A. Auger, N. Hansen: CMA-ES Evolution Strategies and Covariance Matrix Adaptation, tutorial, GECCO'2011
Adaptacja macierzy kowariancji algorytm CMA-ES Δ(1) Δ(2) Rysunek z: A. Auger, N. Hansen: CMA-ES Evolution Strategies and Covariance Matrix Adaptation, tutorial, GECCO'2011
Modyfikacja macierzy kowariancji algorytm CMA-ES (wersja 1) C(1)=I, p c (1)=0 while! stop generuj d i (t) N (0,C (t)),i=1... λ oblicz q i (t)=q (m(t)+σ(t) d i (t )) sortuj według q i (t) μ Δ(t )= μ 1 i=1 d i (t) m(t+1)=m(t)+σ(t ) Δ(t) p c (t+1)=(1 c c ) p c (t)+ 1 (1 c c ) 2 μ Δ(t) C (t+1)=(1 c cov )C (t )+c cov p c (t+1) p c (t+1) T t t+1 bezwładność
Adaptacja skumulowanego kroku algorytm CMA-ES C(1) C(2) Δ(2) p c (t+1)=(1 c c ) p c (t)+ 1 (1 c c ) 2 μ Δ(t) C (t+1)=(1 c cov )C (t )+c cov p c (t+1) p c (t+1) T Rysunek z: A. Auger, N. Hansen: CMA-ES Evolution Strategies and Covariance Matrix Adaptation, tutorial, GECCO'2011
Modyfikacja macierzy kowariancji algorytm CMA-ES (wersja 2) C(1)=I while! stop generuj d i (t) N (0,C (t)),i=1... λ oblicz q i (t)=q (m(t)+σ(t) d i (t )) sortuj według q i (t) μ Δ(t )= μ 1 i=1 d i (t) m(t+1)=m(t)+σ(t ) Δ(t) C (t+1)=(1 c cov )C (t )+c cov i=1 d i (t)d i (t) T t t+1 μ uwzględniene wielu wektorów różnic
Pełny CMA-ES C(1)=I, p c (1)=0, p σ (1)=0 while! stop generuj d i (t) N (0,C (t )),i=1... λ oblicz q i (t )=q (m(t )+σ(t ) d i (t)) sortuj według q i (t) μ Δ(t )= μ 1 i=1 d i (t ) m(t+1)=m(t )+σ(t ) Δ(t) p σ (t+1)=(1 c σ ) p σ (t )+ 1 (1 c σ ) 2 μ Δ(t) σ(t+1)=σ(t) exp( c ( p σ σ d σ E N (0, I ) 1 )) p c (t+1)=(1 c c ) p c (t )+ 1 (1 c c ) 2 μ Δ(t ) C(t+1)=(1 c 1 c μ )C (t )+c 1 p c (t+1) p c (t+1) T +c μ i=1 t t+1 μ d i (t)d i (t ) T