Plan wykładu. Sztuczne sieci neuronowe. Algorytmy gradientowe optymalizacji. Uczenie z nauczycielem. Wykład 4: Algorytmy optymalizacji

Podobne dokumenty
Metoda najszybszego spadku

Rachunek różniczkowy funkcji wielu zmiennych

APROKSYMACJA I INTERPOLACJA. funkcja f jest zbyt skomplikowana; użycie f w dalszej analizie problemu jest trudne

Analiza matematyczna i algebra liniowa

Wyższe momenty zmiennej losowej

n k n k ( ) k ) P r s r s m n m n r s r s x y x y M. Przybycień Rachunek prawdopodobieństwa i statystyka

Analiza algorytmów to dział informatyki zajmujcy si szukaniem najefektywniejszych, poprawnych algorytmów dla danych problemów komputerowych

Teoria Sygnałów. II Inżynieria Obliczeniowa. Wykład 13

N ( µ, σ ). Wyznacz estymatory parametrów µ i. Y które są niezależnymi zmiennymi losowymi.

INDUKCJA MATEMATYCZNA

Wykład 7. Przestrzenie metryczne zwarte. x jest ciągiem Cauchy ego i posiada podciąg zbieżny. Na mocy

METODY NUMERYCZNE dr inż. Mirosław Dziewoński

Prosta w 3. t ( t jest parametrem).

Teoria i metody optymalizacji

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

WYKORZYSTANIE FILTRU CZĄSTECZKOWEGO W PROBLEMIE IDENTYFIKACJI UKŁADÓW AUTOMATYKI

f '. Funkcja h jest ciągła. Załóżmy, że ciąg (z n ) n 0, z n+1 = h(z n ) jest dobrze określony, tzn. n 0 f ' ( z n

Ćwiczenia nr 5. TEMATYKA: Regresja liniowa dla prostej i płaszczyzny

lim a n Cigi liczbowe i ich granice

Wykład 8: Zmienne losowe dyskretne. Rozkłady Bernoulliego (dwumianowy), Pascala, Poissona. Przybliżenie Poissona rozkładu dwumianowego.

Analiza algorytmów to dział informatyki zajmujcy si szukaniem najefektywniejszych, poprawnych algorytmów dla danych problemów komputerowych.

Elementy rach. macierzowego Materiały pomocnicze do MES Strona 1 z 7. Elementy rachunku macierzowego

Analiza I.1, zima globalna lista zadań

O pewnych zastosowaniach rachunku różniczkowego funkcji dwóch zmiennych w ekonomii

Zajęcia nr. 2 notatki

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

Twierdzenia o funkcjach ciągłych

KOMBINATORYKA. Oznaczenia. } oznacza zbiór o elementach a, a2,..., an. Kolejność wypisania elementów zbioru nie odgrywa roli.

Dwumian Newtona. Agnieszka Dąbrowska i Maciej Nieszporski 8 stycznia 2011

tek zauważmy, że podobnie jak w dziedzinie rzeczywistej wprowadzamy dla funkcji zespolonych zmiennej rzeczywistej pochodne wyższych rze

LICZBY, RÓWNANIA, NIERÓWNOŚCI; DOWÓD INDUKCYJNY

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

KLUCZ ODPOWIEDZI I ZASADY PUNKTOWANIA PRÓBNEGO EGZAMINU MATURALNEGO Z MATEMATYKI POZIOM PODSTAWOWY

Matematyka ubezpieczeń majątkowych r.

RÓWNANIA RÓŻNICZKOWE WYKŁAD 11

Prawdopodobieństwo i statystyka r.

Równoliczno zbiorów. Definicja 3.1 Powiemy, e niepuste zbiory A i B s równoliczne jeeli istnieje. Piszemy wówczas A~B. Przyjmujemy dodatkowo, e ~.

3. Wykład III: Warunki optymalności dla zadań bez ograniczeń

ma rozkład złożony Poissona z oczekiwaną liczbą szkód równą λ i rozkładem wartości pojedynczej szkody takim, że Pr( Y

Statystyka Inżynierska

Marek Be±ka, Statystyka matematyczna, wykªad Wykªadnicze rodziny rozkªadów prawdopodobie«stwa

Kombinacje, permutacje czyli kombinatoryka dla testera

OBWODY LINIOWE PRĄDU STAŁEGO

Metody Podejmowania Decyzji

PRZETWORNIKI C/A 1. STRUKTURA PRZETWORNIKA C/A

Funkcje tworz ce skrypt do zada«

Poprawa efektywnoci metody wstecznej propagacji bdu. Jacek Bartman

Pattern Classification

Analiza numeryczna. Stanisław Lewanowicz. Aproksymacja funkcji

KADD Metoda najmniejszych kwadratów

Wykład 11. a, b G a b = b a,

Kontakt,informacja i konsultacje. I Zasada Termodynamiki. Energia wewnętrzna

Matematyka ubezpieczeń majątkowych r. Zadanie 1. Rozważamy proces nadwyżki ubezpieczyciela z czasem dyskretnym postaci: n

Twierdzenie Cayleya-Hamiltona

Elementy nieliniowe w modelach obwodowych oznaczamy przy pomocy symboli graficznych i opisu parametru nieliniowego. C N

PLAN WYKŁADU OPTYMALIZACJA GLOBALNA ALGORYTM MRÓWKOWY (ANT SYSTEM) ALGORYTM MRÓWKOWY. Algorytm mrówkowy

Rozkład normalny (Gaussa)

OBWODY LINIOWE PRĄDU STAŁEGO

WYKŁAD nr 8 METODY CYFROWE POSZUKIWANIA MINIMUM FUNKCJI. Zadania minimalizacji funkcji bez ograniczeń można wyrazić następująco

Teoria i metody optymalizacji

1 Układy równań liniowych

Pojcie estymacji. Metody probabilistyczne i statystyka Wykład 9: Estymacja punktowa. Własnoci estymatorów. Rozkłady statystyk z próby.

MACIERZE STOCHASTYCZNE

Analiza I.1, zima wzorcowe rozwiązania

Józef Borkowski. Metody interpolacji widma i metoda LIDFT w estymacji parametrów sygnału wieloczęstotliwościowego

P = 27, 8 27, 9 27 ). Przechodząc do granicy otrzymamy lim P(Y n > Y n+1 ) = P(Z 1 0 > Z 2 X 2 X 1 = 0)π 0 + P(Z 1 1 > Z 2 X 2 X 1 = 1)π 1 +

WYKŁAD 4 PLAN WYKŁADU. Sieci neuronowe: Algorytmy uczenia & Dalsze zastosowania. Metody uczenia sieci: Zastosowania

MATEMATYKA (poziom podstawowy) przykładowy arkusz maturalny wraz ze schematem oceniania dla klasy II Liceum

Wykład 3 : Podstawowe prawa, twierdzenia i reguły Teorii Obwodów

Zmienna losowa N ma rozkład ujemny dwumianowy z parametrami (, q) = 7,

Prawdopodobieństwo i statystyka r.

Funkcja generująca rozkład (p-two)

15. CAŁKA NIEOZNACZONA cz. I

Sygnały stochastyczne

WYKŁAD 1 INTERPOLACJA WIELOMIANOWA

Stwierdzenie 1. Jeżeli ciąg ma granicę, to jest ona określona jednoznacznie (żaden ciąg nie może mieć dwóch różnych granic).

Logistyka a bezpieczeństwo asymetryczne

( ) O k k k. A k. P k. r k. M O r 1. -P n W. P 1 P k. Rys Redukcja dowolnego przestrzennego układu sił

Metody optymalizacji nieliniowej (metody programowania nieliniowego) Ewa Niewiadomska-Szynkiewicz Instytut Automatyki i Informatyki Stosowanej

D. Miszczyńska, M.Miszczyński KBO UŁ, Badania operacyjne (wykład 6 _ZP) [1] ZAGADNIENIE PRZYDZIAŁU (ZP) (Assignment Problem)

Metody Obliczeniowe w Nauce i Technice laboratorium

Twierdzenia graniczne:

Zadania - powtórzenie do egzaminu dojrzałoci

PERMUTACJE Permutacją zbioru n-elementowego X nazywamy dowolną wzajemnie jednoznaczną funkcję f : X X X

OBLICZENIE SIŁ WEWNĘTRZNYCH DLA BELKI SWOBODNIE PODPARTEJ SWOBODNIE PODPARTEJ ALGORYTM DO PROGRAMU MATHCAD

Wykªad 2. Szeregi liczbowe.

7. OBLICZENIA WIELKOŚCI ZWARCIOWYCH ZA POMOCĄ KOMPUTERÓW

Temat 15. Rozwinięcie Sommerfelda. Elektronowe ciepło właściwe.

Spacery losowe i sieci elektryczne

> 1), wi c na mocy kryterium porównawczego szereg sin(n n)

EKONOMETRIA. Liniowy model ekonometryczny (regresji) z jedną zmienną objaśniającą

Instrukcja do ćwiczeń laboratoryjnych z przedmiotu: Badania operacyjne. Temat ćwiczenia: Problemy transportowe cd, Problem komiwojażera

Parametryzacja rozwiązań układu równań

Rozkłady statystyk z próby. Metody probabilistyczne i statystyka Wykład 2: Rozkłady statystyk z próby. Przedziały ufnoci

WYKŁAD 5 METODY OPTYMALIZACJI NIELINIOWEJ BEZ OGRANICZEŃ

Instalacje i Urządzenia Elektryczne Automatyki Przemysłowej. Modernizacja systemu chłodzenia Ciągu Technologicznego-II część elektroenergetyczna

Kombinatorycznie o tożsamościach kombinatorycznych

Definicja interpolacji

Matematyka wybrane zagadnienia. Lista nr 4

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

Transkrypt:

Pla wyładu yład 4: Algorytmy optymalizacji Małgorzata Krtowsa Katedra Oprogramowaia e-mail: mmac@iipbbialystopl Algorytmy gradietowe optymalizacji Algorytm ajwiszego spadu Algorytm zmieej metryi Algorytm gradietów sprzoych Algorytmy doboru współczyia uczeia adaptacyjy dobór współczyia uczeia dobór współczyia przez miimalizacj ieruow reguła delta-bar-delta metoda gradietów sprzoych z regularyzacj Algorytmy heurystycze algorytm Quicprop algorytm RPROP Uczeie z auczycielem Algorytmy gradietowe optymalizacji Miimalizacja fucji celu E Załadajc cigł fucj atywacji, miimalizacja odbywa si metodami gradietowymi adym rou uczeia wyzacza si tzw ierue miimalizacji p (( Korecja wag odbywa si według wzoru: gdzie η jest współczyiiem uczeia z przedziału [0, ] ( + ( + ηp( ( 3 Algorytmy gradietowe bazuj a rozwiiciu w szereg aylora fucji celu w ajbliszym ssiedztwie zaego rozwizaia [w,w,, w ] (a starcie algorytmu jest to put pocztowy 0 : gdzie: + p + [ g( ] p + p H( p + g( E,,, H ( 4

Algorytmy gradietowe optymalizacji Put jest putem optymalym fucji, jeli g( 0 hesja H( jest dodatio oreloy pratyce ( ze wzgldu a a soczo dołado oblicze załada si, e put jest putem optymalym, jeeli: g( gdzie τ przyjta dołado oblicze 3 τ τ ( + τ ( + ( + Załadamy 0 Ogóly algorytm optymalizacji est: jeeli spełia warui testowe jest putem optymalym to oczymy obliczeia, w przeciwym przypadu pt yzaczaie wetora ieruu poszuiwa p w pucie Miimalizacja ieruowa fucji a ieruu p w celu wyzaczeia taiej wartoci η, aby +η p < yzaczeie owego rozwizaia + +η p oraz odpowiadajcej mu wartoci, g( ( i ew H( i powrót do pt Róice: wyzaczaie ieruu poszuiwa p oraz rou η 5 6 Algorytm ajwiszego spadu Algorytm ajwiszego spadu Ograiczeie do liiowego przyblieia fucji w ajbliszym ssiedztwie zaego rozwizaia : + p + [ g( ] p + O( h Podejcie lasycze + η p + aby + < wystarczy aby [g( ] p < 0 Metoda mometu ηp + α( K etor ieruowy w metodzie ajwiszego spadu przyjmuje posta: p -g( Uwagi: η a płasich odciach p α (dla 09 ozacza to 0 rote przyspieszeie procesu uczeia pozwala a wyjcie z miimów loalych aley otrolowa warto E 7 8

Algorytm ajwiszego spadu yres wpływu działaia mometu a proces uczeia Algorytm zmieej metryi (quasi-newtoa Kwadratowe przyblieie fucji w ssiedztwie zaego rozwizaia : 3 + p + [ g( ] p + p H( p + O( h ierue p jest wyzaczoy ze wzoru: p [ H ( ] g( Metoda weight decay ηp β zabezpiecza przez zbytim wzrostem wag ηp β Problemy: wymóg dodatiej orelooci hesjau w adym rou Rozwizaie zastosowaie przyblieia hesjau przy uyciu metody zmieej metryi 9 0 Algorytm zmieej metryi (quasi-newtoa Algorytm zmieej metryi (quasi-newtoa Przyblieie hesjau polega a modyfiacji hesjau z rou poprzediego o pew popraw, tóra powoduje, e atuala warto hesjau G( przyblia rzywiz fucji celu E zgodie z zaleoci: G( ( - - g( -g( - Na podstawie powyszego załoeia moa otrzyma wzory orelajce hesja w rou -tym: r V r s s s r V V r s V V + + s r s r s r gdzie s - - ; r g( -g( - ; V l [G( ] - warto startowa V 0 pierwsza iteracja zgodie z algorytmem ajwiszego spadu odtwarzaa macierz hesjau jest w adym rou dodatio oreloa (std g( 0 odpowiada rozwizaiu problemu optymalizacji metoda uwaaa za jed z ajlepszych metod optymalizacji fucji wielu zmieych ady: stosuowo dua złooo obliczeiowa ( elemetów hesjau due wymagaia co do pamici przy przechowywaiu macierzy hesjau

Metoda gradietów sprzoych rezygacja z bezporediej iformacji o hesjaie owy ierue poszuiwa ma by ortogoaly i sprzoy z poprzedim ieruami p 0, p,, p -, std: co moa uproci do postaci: p g( współczyi sprzeia (g g( : g ( g β g p + j 0 β p g( + β p g g j j Metoda gradietów sprzoych metoda miej sutecza od metody zmieej metryi, ale bardziej sutecza i metoda ajwiszego spadu stosuje si j do optymalizacji przy bardzo duej liczbie zmieych ze wzgldu a błdy zaorgle w tracie zatraca si właso ortogoaloci midzy wetorami ieruów miimalizacji Po wyoaiu iteracji przeprowadza si jej poowy start ( w I rou zgodie z algorytmem ajwiszego spadu Zbiór wetorów p i jest wzajemie sprzoy wzgldem macierzy H, jeeli p i Hp j 0, i j 3 4 Metody doboru współczyia uczeia Po oreleiu właciwego ieruu p miimalizacji, aley dobra odpowiedi warto współczyia uczeia, aby owy put + leał moliwie ajbliej miimum fucji a ieruu p + + η p Stały współczyi uczeia Stały współczyi uczeia stosuje si główie w połczeiu z metod ajwiszego spadu sposób ajmiej efetywy, gdy ie uzaleia wartoci współczyia od od wetora gradietu oraz ieruu poszuiwa p w daej iteracji algorytm ma słoo utyaia w miimach loalych czsto dobór współczyia odbywa si oddzielie dla adej warstwy, przyjmujc η mi i gdzie i liczba wej i-tego eurou w warstwie 5 6

Adaptacyjy dobór współczyia uczeia zmiay współczyia uczeia dopasowuj si do atualych zmia wartoci fucji celu w czasie arto błdu ε w i-tej iteracji: ε M ( y j d j j orela strategi zmia wartoci współczyia uczeia Przyspieszeie procesu uczeia uzysuje si poprzez cigłe zwiszaie współczyia η sprawdzajc jedoczeie czy ie zaczie wzrasta w porówaiu z błdem obliczoym przy poprzediej wartoci η Adaptacyjy dobór współczyia uczeia Adaptacja współczyia uczeia: ηi ρd gdy εi > wε i ηi + ηiρ i gdy εi wε i gdzie: ε i-, ε i - błd odpowiedio w (i--szej iteracji oraz w i-tej iteracji η i- ; η i - współczyi uczeia w olejych iteracjach w - dopuszczaly współczyi wzrostu błdu ρ d - współczyi zmiejszaia wartoci ρ i - współczyi zwiszajcy warto Przyładowe wartoci współczyiów: w,04; ρ d 07; ρ i 05 7 8 Adaptacyjy dobór współczyia uczeia pływ adaptacyjego doboru współczyia uczeia a proces uczeia Dobór współczyia uczeia przez miimalizacj ieruow Polega a miimalizacji ieruowej fucji celu a wyzaczoym wczeiej ieruu p Cel: taie dobraie wartoci η aby owy put + +η p odpowiadał miimum fucji celu a daym ieruu Jeeli η odpowiada doładie miimum fucji a daym ieruu p to pochoda ieruowa w pucie + +η p musi by rówa 0 pratyce wyzaczoy put + odpowiada tylo w przyblieiu rzeczywistemu putowi miimalemu a daym ieruu 9 0

Dobór współczyia uczeia przez miimalizacj ieruow celu regulacji doładoci wyzaczeia współczyia uczeia wprowadza si współczyi 0<γ <, tóry staowi ułame pochodej fucji celu a ieruu p w pucie wyjciowym Miimalizacja ieruowa Metody bezgradietowe iformacje o wartociach fucji celu wyzaczaie miimum poprzez oleje podziały załooego a wstpie zaresu wartoci wetora Algorytm pozwalajcy a wyzaczeie optymalej wartoci η przeprowadza si dopóty, dopói spełioe s astpujce warui: g +η p p γ g( p oraz [ ( ] [ ] przyjcie 0 γ γ < gwaratuje jedoczese spełieie obu tych waruów [ g( ] p E ( + η p γ η Metody gradietowe wyorzystuj zarówo warto fucji ja te jej pochod wzdłu wetora ieruu p zacze przyspieszeie wyzaczeia miimum a daym ieruu iformacja o ieruu spadu Przyład metody bezgradietowej Metoda bazuje a aprosymacji fucji celu a ieruu p, a astpie wyzacza miimum otrzymaej w te sposób fucji jedej zmieej η ielomia aprosymujcy: P(ηa η +a η +a 0 gdzie a,a,a 0 - współczyii wielomiau orelae w adym cylu optymalizacyjym yzaczaie współczyiów wielomiau wybór trzech dowolych putów,, 3 lecych a ieruu p, tz + η p ; + η p ; 3 + η 3 p ;( - poprzedie rozwizaie; E ; E ; E 3 3 ; wówczas P(η E ; P(η E ; P(η 3 E 3 ; Rozwizujc uład rówa otrzymujemy współczyii wielomiau Porówujc pochod wielomiau do zera otrzymujemy η mi (-a /a Po oreleiu s sprawdzae warui Jeli algorytm ma by otyuoway to wybiera si oleje puty lece a ieruu p w pobliu putu + η mi p 3 Ie metody doboru współczyia uczeia Reguła delta-bar-delta jest metod adaptacyj opracowa dla wadratowej defiicji fucji celu i metody ajwiszego spadu adej wadze jest przyporzdoway idywidualie dobray współczyi uczeia ada: dua złooo obliczeiowa Zaleta: przyspieszeie procesu uczeia i zwiszeie prawdopodobiestwa osigicia miimum globalego Metoda gradietów sprzoych z regularyzacj odmiaa zwyłej metody gradietów sprzoych łczc jedoczeie wyzaczaie ieruu p oraz optymalego rou 4

Algorytm Quicprop odmiaa algorytmu gradietowego zawiera elemety metody ewtoowsiej i wiedzy heurystyczej zawiera elemety zabezpieczajce przez uticiem w płytim miimum loalym (ze wzgldu a asyceie eurou Zmiaa wagi w -tym rou ( ( ( η + γ ( + α ( Zalety: szyba zbieo dla wiszoci trudych problemów ilusetrote przyspieszeie procesu uczeia (w porówaiu z algorytmem ajwiszego spadu małe prawdopodobiestwo uticia w miimum loalym Algorytm RPROP (ag Resilet bacpropagatio ( ( η mi a ( η max b gdzie ( ( S ( a; b05 ( ( sg ( ( η, ηmax ( ( η, η η ( S ( S ( < 0 w pozostalyc h przypadach η mi ; η max - miimala i masymala warto współczyia uczeia (0-6 ; 50 mi Zalety przyspieszeie procesu uczeia w obszarach gdzie achyleie fucji celu jest iewielie dla dla S ( S ( > 0 5 6